هیوتر لایتمن، پژوهشگر OpenAI، تنها چندی پس از پیوستن به این شرکت در سال 2022، شاهد رونمایی از ChatGPT، یکی از سریعترین محصولات در حال رشد در تاریخ فناوری، بود. در این میان، لایتمن به طور آرام به همراه تیمی مشغول به آموزش مدلهای OpenAI برای حل مسائل رقابتهای ریاضی در سطح دبیرستان بود. امروز این تیم، که با نام MathGen شناخته میشود، بهعنوان یکی از ارکان اصلی تلاش OpenAI برای توسعه مدلهای استدلال هوش مصنوعی شناخته میشود: فناوری حیاتی که پشتوانهای برای ایجاد سیستمهایی است که میتوانند وظایف کامپیوتری را مانند انسان انجام دهند.
لایتمن در مصاحبهای با TechCrunch میگوید: “ما سعی میکردیم مدلها را در استدلال ریاضی تقویت کنیم، چرا که در آن زمان تسلط چندانی در این زمینه نداشتند.” اگر چه مدلهای OpenAI همچنان دور از کمال هستند و با چالشهایی در انجام وظایف پیچیده روبرو هستند، اما به وضوح در زمینه استدلال ریاضی پیشرفت قابل توجهی داشتهاند. یکی از مدلهای OpenAI بهتازگی برنده مدال طلا در المپیاد جهانی ریاضی شد، یک رقابت معتبر برای brightest دانشآموزان دبیرستانی.
OpenAI بر این باور است که این تواناییهای استدلالی میتواند به دیگر زمینهها منتقل شود و در نهایت محرک اصلی برای توسعه سیستمهای هوش مصنوعی چندمنظورهای باشد که همواره در آرزوی ساخت آن بودهاند. CEO OpenAI، سم آلتمن، در نخستین کنفرانس توسعهدهندگان شرکت در سال 2023 گفت: “سرانجام شما فقط از کامپیوتر درخواست میکنید و آن تمامی این کارها را برای شما انجام میدهد.”
انتشار مدل استدلال هوش مصنوعی o1 در پاییز 2024، جهان را شگفتزده کرد. کمتر از یک سال بعد، 21 پژوهشگر بنیادی این مدل به ارزشمندترین استعدادها در سیلیکونولی تبدیل شدند. مارک زاکربرگ پنج نفر از پژوهشگران o1 را به کار در واحد جدید Meta که تمرکز بر هوش فوقالعاده دارد، جذب کرد و بستههای جبرانی کمکی بیشتر از 100 میلیون دلار را ارائه داد.
افزایش مدلهای استدلال و نمایندگیهای OpenAI با تکنیکهای آموزش یادگیری ماشین به نام یادگیری تقویتی (RL) مرتبط است. RL به مدلهای هوش مصنوعی بازخورد میدهد که آیا انتخابهای آنها در محیطهای شبیهسازیشده صحیح بوده است یا خیر. این روش از دههها پیش استفاده میشود و الگوریتمهای آن به توسعههای عظیمی در هوش مصنوعی منجر شدهاند.
تحقیقاتی که OpenAI انجام داده، متکی به استفاده از قدرت محاسباتی بیشتر در طی مراحل پسآموزش و همچنین اختصاص زمان و انرژی بیشتر به مدلها در حین پاسخگویی به سوالات است. در سال 2023، OpenAI با ترکیب LLMها، RL و روشی به نام محاسبه در زمان پاسخ، موفق به شکستن محدودیتهای پیشین در استدلال ریاضی شد.
با پیشرفتهای اخیر، OpenAI در حال توسعه مدلهایی است که قادر به حل مسائل پیچیدهتر و مضامین متعدد هستند. در حال حاضر جایگاه رقبای قدرمندی مانند گوگل، Anthropic و Meta را نیز در نظر دارد. آیا OpenAI میتواند در این رقابت پیروز شود و چشماندازهای آینده خود را محقق کند؟ این سؤالی است که در سالهای پیش رو به وضوح پاسخ آن مشخص خواهد شد.
