سخنرانی جدید OpenAI: بازگشت به ریشهها با انتشار مدلهای متنباز
شرکت OpenAI با اعلام و انتشار دو مدل جدید زبان بزرگ متنباز با نامهای gpt-oss-120b و gpt-oss-20b، به ریشههای خود به عنوان یک شرکت هوش مصنوعی متنباز بازگشته است. مدل gpt-oss-120b با ۱۲۰ میلیارد پارامتر و قابلیت اجرا بر روی یک واحد پردازش گرافیکی Nvidia H100 طراحی شده است، در حالی که مدل gpt-oss-20b با ۲۰ میلیارد پارامتر به اندازهای کوچک است که میتواند در دستگاههای لپتاپ یا رایانه شخصی اجرا شود. این مدلها به صورت متنمحور عمل میکنند و به کاربران این امکان را میدهند تا تنها پیغامهای متنی را وارد کنند و پاسخهای متنی دریافت کنند. با این حال، آنها همچنان قادر به نوشتن کد و ارائه مسائل ریاضی هستند و در انجام این وظایف در سطحی بالاتر از برخی مدلهای پرداختی OpenAI و رقبا در سطح جهانی عملکرد دارند.
مدلهای جدید به ابزارهای خارجی از جمله جستجوی وب متصل میشوند تا کارهای تحقیقاتی به نمایندگی از کاربر انجام دهند. از جمله ویژگیهای برجسته این مدلها، عدم وجود هزینه برای کاربران است. این مدلها بهصورت رایگان برای دانلود و استفاده در دسترس هستند و به کاربران، توسعهدهندگان مستقل و شرکتها اجازه میدهند تا آنها را بهدلخواه خود تغییر دهند و بدون نیاز به اتصال به اینترنت اجرا کنند، که این موضوع حداکثر حریم خصوصی را فراهم میآورد؛ برخلاف دیگر مدلهای برتر OpenAI و رقبای آمریکایی مانند گوگل و Anthropic.
مدل gpt-oss-120b در بعضی از مقایسهها با مدلهای اختصاصی OpenAI، نشان داده است که در زمینه استدلال و استفاده از ابزارها عملکردی برابر یا بالاتر از مدل o4-mini دارد. همچنین، gpt-oss-20b در برخی معیارها از o3-mini پیشی گرفته است. این مدلها چندزبان هستند و عملکرد خوبی در زبانهای غیرانگلیسی دارند.
OpenAI مجوز Apache 2.0 را برای هر دو مدل ارائه کرده که این مجوز به کاربران این امکان را میدهد تا این مدلها را دانلود، تنظیم و تغییر دهند و از آنها برای تولید درآمد یا ارائه خدمات پولی استفاده کنند، بدون اینکه هزینهای به OpenAI پرداخت کنند. با توجه به شرایط جدید، این امکان برای صنایع با نظارت بالا مانند مالی، بهداشت و درمان، و خدمات حقوقی به شدت حائز اهمیت است.
مدلهای gpt-oss هماکنون در پلتفرمهای مشابه Hugging Face و GitHub قابل دانلود هستند و میتوانند با پشتیبانی از طریق پلتفرمهای مختلفی مانند Azure، AWS و Cloudflare انجام شوند. OpenAI همچنین یک چالش به ارزش ۵۰۰ هزار دلار را برای بررسی نقاط ضعف این مدلها برگزار کرده و دعوت کرده است تا محققان و توسعهدهندگان به بررسی و شناسایی مسیرهای جدید سوءاستفاده بپردازند.
انتشار این مدلها نه تنها به عنوان یک دعوت به همکاری برای توسعهدهندگان، شرکتها و دولتها تلقی میشود، بلکه نقطه عطفی در استراتژی OpenAI برای بازگشت به بازار مدلهای متنباز در شرایط رقابتی کنونی است. با روند رو به رشد استفاده از مدلهای متنباز در سطح جهانی، این اقدام میتواند نقش مهمی در شکلگیری آینده هوش مصنوعی ایفا کند.
