اوپنای آی، صبح امروز خانوادهای جدید از مدلهای هوش مصنوعی را معرفی کرد که بهطور قابلتوجهی توانمندیهای کدنویسی را بهبود میبخشد و در عین حال هزینهها را کاهش میدهد. این شرکت مستقر در سان فرانسیسکو، سه مدل جدید به نامهای GPT-4.1، GPT-4.1 مینی و GPT-4.1 نانو را معرفی کرده است که همگی بهطور فوری از طریق API این شرکت در دسترس هستند. این مدلهای جدید عملکرد بهتری در وظایف مهندسی نرمافزار دارند، دستورات را با دقت بیشتری دنبال میکنند و میتوانند تا یک میلیون توکن از متن را پردازش کنند که معادل حدود ۷۵۰ هزار کلمه است.
کوین وایل، مدیر محصول اوپنای آی، در مراسم رونمایی بیان کرد: “مدل GPT-4.1 عملکرد استثنایی با هزینهای کمتر ارائه میدهد.” او افزود: “این مدلها در تقریباً تمام ابعاد بهتر از GPT-4o عمل میکنند.” نکتهای که برای مشتریان سازمانی بسیار حائز اهمیت است، هزینههاست: هزینه GPT-4.1 نسبت به مدل قبلی ۲۶٪ کاهش دارد، در حالی که نسخه سبک نانو به ارزانترین پیشنهاد اوپنای آی تبدیل میشود و تنها ۱۲ سنت به ازای هر میلیون توکن هزینه دارد.
میشل پوکرَس، مسئول تحقیقات پس از آموزش در اوپنای آی، در مصاحبهای صادقانه با وبسایت VentureBeat تأکید کرد که کاربردهای عملی تجاری، فرآیند توسعه این مدل را هدایت کرده است. او گفت: “هدف ما از آموزش GPT-4.1 این بوده که برای توسعهدهندگان مفید باشد. ما دریافتهایم که GPT-4.1 در دنبال کردن نوع دستورات معمول در سازمانها بسیار بهتر عمل میکند که این مسأله پیادهسازی برنامههای آماده برای تولید را تسهیل میکند.”
این توجه به کارایی در شرایط واقعی در نتایج بنچمارک مشهود است. در آزمون SWE-bench Verified، که قابلیتهای مهندسی نرمافزار را اندازهگیری میکند، مدل GPT-4.1 نمره ۵۴.۶٪ را کسب کرد که نشاندهنده بهبود ۲۱.۴ امتیازی نسبت به GPT-4o است. برای شرکتهایی که بهدنبال توسعهی عوامل هوش مصنوعی هستند که بهطور مستقل بر روی وظایف پیچیده کار کنند، بهبود در پیگیری دستورات ارزشمند است. در آزمون MultiChallenge Scale، این مدل نمره ۳۸.۳٪ را بدست آورد و ۱۰.۵ درصد بهتر از GPT-4o عمل کرد.
معرفی سه مدل متمایز در محدودههای قیمتی مختلف، به تنوع بازار هوش مصنوعی پاسخ میدهد. مدل پرچمدار GPT-4.1 برای کاربردهای پیچیده سازمانی طراحی شده است، در حالی که نسخههای مینی و نانو به کاربردهایی که سرعت و کارایی هزینه در اولویت است، میپردازند. پوکرَس در این زمینه تأکید کرد: “همه وظایف نیاز به بالاترین هوش یا بهترین قابلیتها ندارند. نانو قرار است مدل اصلی برای کاربردهایی مانند تکمیل خودکار، طبقهبندی، استخراج داده باشد یا هر چیز دیگری که در آن سرعت اولویت دارد.”
بهطور همزمان، اوپنای آی اعلام کرد که قصد دارد مدل GPT-4.5 Preview را — که بزرگترین و پرهزینهترین مدل این شرکت بود و تنها دو ماه پیش منتشر شد — تا تاریخ ۱۴ جولای از API خود حذف کند. این شرکت، مدل GPT-4.1 را بهعنوان جایگزینی مقرون به صرفهتر معرفی کرده است که “عملکرد بهتری یا مشابهی در بسیاری از تواناییهای کلیدی با هزینه و تأخیر کمتر ارائه میدهد.” این حرکت به اوپنای آی اجازه میدهد منابع محاسباتی را بازپسگیرد و گزینهای کارآمدتر را به توسعهدهندگان ارائه دهد.
چندین مشتری شرکتی که پیش از رونمایی مدلها را آزمایش کرده بودند، بهبودهای قابلتوجهی در حوزههای خاص خود گزارش کردند. برای مثال، شرکت Thomson Reuters در استفاده از GPT-4.1 همراه با دستیار هوش مصنوعی حقوقی خود، CoCounsel، شاهد بهبود ۱۷٪ در دقت بررسی چندمدرکی بود. همچنین، شرکت مالی Carlyle به بهبود ۵۰٪ در استخراج دادههای مالی جزئی از مستندات متراکم دست یافت.
همه سه مدل دارای یک پنجره زمینه یک میلیون توکنی هستند که هشت برابر بزرگتر از محدودیت ۱۲۸,۰۰۰ توکنی GPT-4o است. این ظرفیت گسترش یافته به مدلها این امکان را میدهد تا چندین سند طولانی یا کل کد را بهطور همزمان پردازش کنند. در یک نمایش، اوپنای آی نشان داد که GPT-4.1 چگونه یک فایل لاگ سرور ۴۵۰,۰۰۰ توکنی متعلق به ناسا در سال ۱۹۹۵ را تجزیه و تحلیل کرده و ورودی غیرعادیای را که در عمق دادهها پنهان شده بود، شناسایی کرد.
با این حال، اوپنای آی به کاهش عملکرد با ورودیهای بسیار بزرگ نیز تأکید کرده است. در آزمون داخلی OpenAI-MRCR، دقت از حدود ۸۴٪ با ۸۰۰۰ توکن به ۵۰٪ با یک میلیون توکن کاهش یافت. عرضۀ این مدلها در حالی است که رقابت در فضای هوش مصنوعی سازمانی رو به فزونی است. گوگل به تازگی مدل Gemini 2.5 Pro را با یک پنجره زمینه یک میلیون توکنی معرفی کرده و مدل Claude 3.7 از Anthropic نیز در میان کسبوکارها به محبوبیت دست یافته است.
با انتشار این مدلها بهطور خاص از طریق API خود بهجای ChatGPT، اوپنای آی تعهد خود را به توسعهدهندگان و مشتریان سازمانی اعلام میکند. این شرکت برنامه دارد به تدریج ویژگیهای GPT-4.1 را به ChatGPT اضافه کند، اما تمرکز اصلی آن بر فراهم آوردن ابزارهای قوی برای کسبوکارهاست.
بهمنظور تشویق تحقیقات بیشتر در پردازش متنهای طولانی، اوپنای آی دو مجموعه داده ارزیابی منتشر میکند: OpenAI-MRCR برای آزمایش تواناییهای هستهای چنددورهای و Graphwalks برای ارزیابی استدلال پیچیده در مستندات طولانی.
خانواده مدلهای GPT-4.1 رویکردی عملی و مقرون به صرفهتری برای پیادهسازی هوش مصنوعی ارائه میدهد. با ادامه ادغام هوش مصنوعی در عملیات سازمانها، این بهبودها در قابل اعتماد بودن، دقت و کارایی میتواند به پذیرش سریعتر در صنایعی که هنوز هزینههای پیادهسازی را علیه مزایای بالقوه میسنجند، منجر شود.
در حالی که رقباء بهدنبال مدلهای بزرگتر و پرهزینهتر هستند، تغییر استراتژیک اوپنای آی با GPT-4.1 نشان میدهد که آینده هوش مصنوعی شاید نه در بزرگترین مدلها، بلکه در کارآمدترینها باشد. دستاورد واقعی ممکن است نه در بنچمارکها، بلکه در فراهم آوردن هوش مصنوعی در سطح سازمانی برای دسترسی به بیشتر کسبوکارها باشد.