مدل‌های جدید GPT-4.1 OpenAI: پردازش یک میلیون توکن و حل مشکلات کدنویسی با کیفیت بالاتر

اوپن‌ای آی، صبح امروز خانواده‌ای جدید از مدل‌های هوش مصنوعی را معرفی کرد که به‌طور قابل‌توجهی توانمندی‌های کدنویسی را بهبود می‌بخشد و در عین حال هزینه‌ها را کاهش می‌دهد. این شرکت مستقر در سان فرانسیسکو، سه مدل جدید به نام‌های GPT-4.1، GPT-4.1 مینی و GPT-4.1 نانو را معرفی کرده است که همگی به‌طور فوری از طریق API این شرکت در دسترس هستند. این مدل‌های جدید عملکرد بهتری در وظایف مهندسی نرم‌افزار دارند، دستورات را با دقت بیشتری دنبال می‌کنند و می‌توانند تا یک میلیون توکن از متن را پردازش کنند که معادل حدود ۷۵۰ هزار کلمه است.

کوین وایل، مدیر محصول اوپن‌ای آی، در مراسم رونمایی بیان کرد: “مدل GPT-4.1 عملکرد استثنایی با هزینه‌ای کمتر ارائه می‌دهد.” او افزود: “این مدل‌ها در تقریباً تمام ابعاد بهتر از GPT-4o عمل می‌کنند.” نکته‌ای که برای مشتریان سازمانی بسیار حائز اهمیت است، هزینه‌هاست: هزینه GPT-4.1 نسبت به مدل قبلی ۲۶٪ کاهش دارد، در حالی که نسخه سبک نانو به ارزان‌ترین پیشنهاد اوپن‌ای آی تبدیل می‌شود و تنها ۱۲ سنت به ازای هر میلیون توکن هزینه دارد.

میشل پوکرَس، مسئول تحقیقات پس از آموزش در اوپن‌ای آی، در مصاحبه‌ای صادقانه با وب‌سایت VentureBeat تأکید کرد که کاربردهای عملی تجاری، فرآیند توسعه این مدل را هدایت کرده است. او گفت: “هدف ما از آموزش GPT-4.1 این بوده که برای توسعه‌دهندگان مفید باشد. ما دریافته‌ایم که GPT-4.1 در دنبال کردن نوع دستورات معمول در سازمان‌ها بسیار بهتر عمل می‌کند که این مسأله پیاده‌سازی برنامه‌های آماده برای تولید را تسهیل می‌کند.”

این توجه به کارایی در شرایط واقعی در نتایج بنچمارک مشهود است. در آزمون SWE-bench Verified، که قابلیت‌های مهندسی نرم‌افزار را اندازه‌گیری می‌کند، مدل GPT-4.1 نمره ۵۴.۶٪ را کسب کرد که نشان‌دهنده بهبود ۲۱.۴ امتیازی نسبت به GPT-4o است. برای شرکت‌هایی که به‌دنبال توسعه‌ی عوامل هوش مصنوعی هستند که به‌طور مستقل بر روی وظایف پیچیده کار کنند، بهبود در پیگیری دستورات ارزشمند است. در آزمون MultiChallenge Scale، این مدل نمره ۳۸.۳٪ را بدست آورد و ۱۰.۵ درصد بهتر از GPT-4o عمل کرد.

معرفی سه مدل متمایز در محدوده‌های قیمتی مختلف، به تنوع بازار هوش مصنوعی پاسخ می‌دهد. مدل پرچمدار GPT-4.1 برای کاربردهای پیچیده سازمانی طراحی شده است، در حالی که نسخه‌های مینی و نانو به کاربردهایی که سرعت و کارایی هزینه در اولویت است، می‌پردازند. پوکرَس در این زمینه تأکید کرد: “همه وظایف نیاز به بالاترین هوش یا بهترین قابلیت‌ها ندارند. نانو قرار است مدل اصلی برای کاربردهایی مانند تکمیل خودکار، طبقه‌بندی، استخراج داده باشد یا هر چیز دیگری که در آن سرعت اولویت دارد.”

به‌طور همزمان، اوپن‌ای آی اعلام کرد که قصد دارد مدل GPT-4.5 Preview را — که بزرگ‌ترین و پرهزینه‌ترین مدل این شرکت بود و تنها دو ماه پیش منتشر شد — تا تاریخ ۱۴ جولای از API خود حذف کند. این شرکت، مدل GPT-4.1 را به‌عنوان جایگزینی مقرون به صرفه‌تر معرفی کرده است که “عملکرد بهتری یا مشابهی در بسیاری از توانایی‌های کلیدی با هزینه و تأخیر کمتر ارائه می‌دهد.” این حرکت به اوپن‌ای آی اجازه می‌دهد منابع محاسباتی را بازپس‌گیرد و گزینه‌ای کارآمدتر را به توسعه‌دهندگان ارائه دهد.

چندین مشتری شرکتی که پیش از رونمایی مدل‌ها را آزمایش کرده بودند، بهبودهای قابل‌توجهی در حوزه‌های خاص خود گزارش کردند. برای مثال، شرکت Thomson Reuters در استفاده از GPT-4.1 همراه با دستیار هوش مصنوعی حقوقی خود، CoCounsel، شاهد بهبود ۱۷٪ در دقت بررسی چندمدرکی بود. همچنین، شرکت مالی Carlyle به بهبود ۵۰٪ در استخراج داده‌های مالی جزئی از مستندات متراکم دست یافت.

همه سه مدل دارای یک پنجره زمینه یک میلیون توکنی هستند که هشت برابر بزرگ‌تر از محدودیت ۱۲۸,۰۰۰ توکنی GPT-4o است. این ظرفیت گسترش یافته به مدل‌ها این امکان را می‌دهد تا چندین سند طولانی یا کل کد را به‌طور همزمان پردازش کنند. در یک نمایش، اوپن‌ای آی نشان داد که GPT-4.1 چگونه یک فایل لاگ سرور ۴۵۰,۰۰۰ توکنی متعلق به ناسا در سال ۱۹۹۵ را تجزیه و تحلیل کرده و ورودی غیرعادی‌ای را که در عمق داده‌ها پنهان شده بود، شناسایی کرد.

با این حال، اوپن‌ای آی به کاهش عملکرد با ورودی‌های بسیار بزرگ نیز تأکید کرده است. در آزمون داخلی OpenAI-MRCR، دقت از حدود ۸۴٪ با ۸۰۰۰ توکن به ۵۰٪ با یک میلیون توکن کاهش یافت. عرضۀ این مدل‌ها در حالی است که رقابت در فضای هوش مصنوعی سازمانی رو به فزونی است. گوگل به تازگی مدل Gemini 2.5 Pro را با یک پنجره زمینه یک میلیون توکنی معرفی کرده و مدل Claude 3.7 از Anthropic نیز در میان کسب‌وکارها به محبوبیت دست یافته است.

با انتشار این مدل‌ها به‌طور خاص از طریق API خود به‌جای ChatGPT، اوپن‌ای آی تعهد خود را به توسعه‌دهندگان و مشتریان سازمانی اعلام می‌کند. این شرکت برنامه دارد به تدریج ویژگی‌های GPT-4.1 را به ChatGPT اضافه کند، اما تمرکز اصلی آن بر فراهم آوردن ابزارهای قوی برای کسب‌وکارهاست.

به‌منظور تشویق تحقیقات بیشتر در پردازش متن‌های طولانی، اوپن‌ای آی دو مجموعه داده ارزیابی منتشر می‌کند: OpenAI-MRCR برای آزمایش توانایی‌های هسته‌ای چنددوره‌ای و Graphwalks برای ارزیابی استدلال پیچیده در مستندات طولانی.

خانواده مدل‌های GPT-4.1 رویکردی عملی و مقرون به صرفه‌تری برای پیاده‌سازی هوش مصنوعی ارائه می‌دهد. با ادامه ادغام هوش مصنوعی در عملیات سازمان‌ها، این بهبودها در قابل اعتماد بودن، دقت و کارایی می‌تواند به پذیرش سریع‌تر در صنایعی که هنوز هزینه‌های پیاده‌سازی را علیه مزایای بالقوه می‌سنجند، منجر شود.

در حالی که رقباء به‌دنبال مدل‌های بزرگ‌تر و پرهزینه‌تر هستند، تغییر استراتژیک اوپن‌ای آی با GPT-4.1 نشان می‌دهد که آینده هوش مصنوعی شاید نه در بزرگ‌ترین مدل‌ها، بلکه در کارآمدترین‌ها باشد. دستاورد واقعی ممکن است نه در بنچمارک‌ها، بلکه در فراهم آوردن هوش مصنوعی در سطح سازمانی برای دسترسی به بیشتر کسب‌وکارها باشد.

چت آنلاین با هوش مصنوعی

مدل‌های جدید GPT-4.1 OpenAI: پردازش یک میلیون توکن و حل مشکلات کدنویسی با کیفیت بالاتر

دیدگاه‌ خود را بنویسید لغو پاسخ