انتشار مدل‌های جدید هوش مصنوعی از سوی OpenAI: o3 و o4-mini

OpenAI در روز چهارشنبه با افتخار از معرفی دو مدل جدید هوش مصنوعی به نام‌های o3 و o4-mini خبر داد. این مدل‌ها به‌طور خاص برای تحلیل و پردازش سوالات قبل از ارائه پاسخ طراحی شده‌اند. OpenAI o3 را پیشرفته‌ترین مدل استدلال خود می‌داند که در آزمون‌های مختلف شامل ریاضیات، برنامه‌نویسی، استدلال، علوم و درک بصری، برتری قابل توجهی نسبت به مدل‌های قبلی خود داشته است.

مدل o4-mini نیز به‌عنوان یک گزینه رقابتی به‌ویژه در زمینه قیمت، سرعت و عملکرد به توسعه‌دهندگان ارائه می‌شود. این سه عامل از مهم‌ترین نکات مورد بررسی توسعه‌دهندگان در انتخاب مدل‌های هوش مصنوعی برای برنامه‌های کاربردی خود به شمار می‌آیند. برخلاف مدل‌های استدلال قبلی، o3 و o4-mini می‌توانند از ابزارهای موجود در ChatGPT، مانند مرور وب، اجرای کد پایتون، پردازش تصویر و تولید تصویر استفاده کنند تا پاسخ‌های بهتری را تولید نمایند.

از امروز، این مدل‌ها، به همراه نسخه‌ای از o4-mini به نام “o4-mini-high” که زمان بیشتری را برای ارائه پاسخ‌های دقیق‌تر صرف می‌کند، برای مشترکین طرح‌های Pro، Plus و Team OpenAI در دسترس قرار گرفته است. این مدل‌های جدید بخشی از تلاش‌های OpenAI برای رقابت با دیگر شرکت‌های بزرگ در عرصه هوش مصنوعی از جمله گوگل، متا، xAI، Anthropic و DeepSeek هستند.

مدل o3 در آزمون SWE-bench، که توانایی‌های برنامه‌نویسی را مورد سنجش قرار می‌دهد، امتیاز 69.1% را کسب کرده است و o4-mini نیز امتیاز 68.1% را در این آزمون به دست آورده است. همچنین مدل o3-mini پس از آن، با امتیاز 49.3% و Claude 3.7 Sonnet با 62.3% در جایگاه‌های بعدی قرار دارند.

OpenAI اعلام کرده است که o3 و o4-mini اولین مدل‌های این شرکت هستند که قادر به “تفکر با تصاویر” می‌باشند. به‌طور عملی، کاربران می‌توانند تصاویر مختلفی نظیر طراحی‌های وایت‌برد یا نمودارهای موجود در PDF را به ChatGPT آپلود کرده و این مدل‌ها در حین پاسخ‌گویی به سوالات، به تحلیل تصاویر می‌پردازند. این قابلیت جدید به o3 و o4-mini امکان می‌دهد تا تصاویر کم کیفیت و مبهم را درک کرده و اقداماتی نظیر زوم یا چرخاندن تصاویر را در حین استدلال انجام دهند.

علاوه بر قابلیت‌های پردازش تصویر، این دو مدل می‌توانند کد پایتون را به‌طور مستقیم در مرورگر کاربر از طریق ویژگی Canvas در ChatGPT اجرا کنند و در صورت سوال درباره رویدادهای جاری، می‌توانند وب را جستجو کنند. تمامی سه مدل o3، o4-mini و o4-mini-high از طریق APIهای ارائه‌شده برای توسعه‌دهندگان OpenAI، با نرخ‌های مبتنی بر استفاده در دسترس خواهند بود.

OpenAI قیمت نسبتاً پایینی برای استفاده از o3، یعنی 10 دلار به ازای هر میلیون توکن ورودی (تقریباً معادل 750,000 کلمه) و 40 دلار برای هر میلیون توکن خروجی، در نظر گرفته است. برای مدل o4-mini نیز همانند o3-mini هزینه 1.10 دلار به ازای هر میلیون توکن ورودی و 4.40 دلار برای هر میلیون توکن خروجی تعیین شده است. به‌زودی، OpenAI قصد دارد نسخه‌ای به نام o3-pro از o3 را منتشر کند که منابع محاسباتی بیشتری را برای تولید پاسخ‌های خود استفاده خواهد کرد و تنها برای مشترکین ChatGPT Pro در دسترس خواهد بود.

مدیرعامل OpenAI، سم آلتمن، نشان داده است که o3 و o4-mini ممکن است آخرین مدل‌های مستقل استدلال هوش مصنوعی در ChatGPT قبل از مدل GPT-5 باشند، که به گفته شرکت، این مدل، سنتی را با مدل‌های استدلالی خود اوریجام می‌دهد.

تبدیل گفتار به نوشتار

دیدگاه‌ خود را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

اسکرول به بالا