انتشار مدلهای جدید هوش مصنوعی از سوی OpenAI: o3 و o4-mini
OpenAI در روز چهارشنبه با افتخار از معرفی دو مدل جدید هوش مصنوعی به نامهای o3 و o4-mini خبر داد. این مدلها بهطور خاص برای تحلیل و پردازش سوالات قبل از ارائه پاسخ طراحی شدهاند. OpenAI o3 را پیشرفتهترین مدل استدلال خود میداند که در آزمونهای مختلف شامل ریاضیات، برنامهنویسی، استدلال، علوم و درک بصری، برتری قابل توجهی نسبت به مدلهای قبلی خود داشته است.
مدل o4-mini نیز بهعنوان یک گزینه رقابتی بهویژه در زمینه قیمت، سرعت و عملکرد به توسعهدهندگان ارائه میشود. این سه عامل از مهمترین نکات مورد بررسی توسعهدهندگان در انتخاب مدلهای هوش مصنوعی برای برنامههای کاربردی خود به شمار میآیند. برخلاف مدلهای استدلال قبلی، o3 و o4-mini میتوانند از ابزارهای موجود در ChatGPT، مانند مرور وب، اجرای کد پایتون، پردازش تصویر و تولید تصویر استفاده کنند تا پاسخهای بهتری را تولید نمایند.
از امروز، این مدلها، به همراه نسخهای از o4-mini به نام “o4-mini-high” که زمان بیشتری را برای ارائه پاسخهای دقیقتر صرف میکند، برای مشترکین طرحهای Pro، Plus و Team OpenAI در دسترس قرار گرفته است. این مدلهای جدید بخشی از تلاشهای OpenAI برای رقابت با دیگر شرکتهای بزرگ در عرصه هوش مصنوعی از جمله گوگل، متا، xAI، Anthropic و DeepSeek هستند.
مدل o3 در آزمون SWE-bench، که تواناییهای برنامهنویسی را مورد سنجش قرار میدهد، امتیاز 69.1% را کسب کرده است و o4-mini نیز امتیاز 68.1% را در این آزمون به دست آورده است. همچنین مدل o3-mini پس از آن، با امتیاز 49.3% و Claude 3.7 Sonnet با 62.3% در جایگاههای بعدی قرار دارند.
OpenAI اعلام کرده است که o3 و o4-mini اولین مدلهای این شرکت هستند که قادر به “تفکر با تصاویر” میباشند. بهطور عملی، کاربران میتوانند تصاویر مختلفی نظیر طراحیهای وایتبرد یا نمودارهای موجود در PDF را به ChatGPT آپلود کرده و این مدلها در حین پاسخگویی به سوالات، به تحلیل تصاویر میپردازند. این قابلیت جدید به o3 و o4-mini امکان میدهد تا تصاویر کم کیفیت و مبهم را درک کرده و اقداماتی نظیر زوم یا چرخاندن تصاویر را در حین استدلال انجام دهند.
علاوه بر قابلیتهای پردازش تصویر، این دو مدل میتوانند کد پایتون را بهطور مستقیم در مرورگر کاربر از طریق ویژگی Canvas در ChatGPT اجرا کنند و در صورت سوال درباره رویدادهای جاری، میتوانند وب را جستجو کنند. تمامی سه مدل o3، o4-mini و o4-mini-high از طریق APIهای ارائهشده برای توسعهدهندگان OpenAI، با نرخهای مبتنی بر استفاده در دسترس خواهند بود.
OpenAI قیمت نسبتاً پایینی برای استفاده از o3، یعنی 10 دلار به ازای هر میلیون توکن ورودی (تقریباً معادل 750,000 کلمه) و 40 دلار برای هر میلیون توکن خروجی، در نظر گرفته است. برای مدل o4-mini نیز همانند o3-mini هزینه 1.10 دلار به ازای هر میلیون توکن ورودی و 4.40 دلار برای هر میلیون توکن خروجی تعیین شده است. بهزودی، OpenAI قصد دارد نسخهای به نام o3-pro از o3 را منتشر کند که منابع محاسباتی بیشتری را برای تولید پاسخهای خود استفاده خواهد کرد و تنها برای مشترکین ChatGPT Pro در دسترس خواهد بود.
مدیرعامل OpenAI، سم آلتمن، نشان داده است که o3 و o4-mini ممکن است آخرین مدلهای مستقل استدلال هوش مصنوعی در ChatGPT قبل از مدل GPT-5 باشند، که به گفته شرکت، این مدل، سنتی را با مدلهای استدلالی خود اوریجام میدهد.