خبر: انتشار مدل جدید هوش مصنوعی Phi-4-reasoning-plus توسط مایکروسافت
در روزهای اخیر، مایکروسافت از انتشار مدل زبان جدیدی به نام Phi-4-reasoning-plus خبر داد که بهطور خاص برای انجام وظایف نیازمند استدلال عمیق و ساختارمند طراحی شده است. این مدل با بهرهگیری از ساختار مدل پیشین Phi-4، شامل آموزش نظارت شده و یادگیری تقویتی میباشد و عملکرد بهتری را در زمینههای ریاضی، علوم، برنامهنویسی و وظایف مبتنی بر منطق ارائه میدهد.
مدل Phi-4-reasoning-plus دارای 14 میلیارد پارامتر و بر پایه تکنیکهای رمزگذاری فقط از نوع ترانسفورمر میباشد و بر کیفیت به جای مقیاس تأکید دارد. فرآیند آموزش این مدل شامل 16 میلیارد توکن است که حدود 8.3 میلیارد از آنها منحصر به فرد هستند و از مجموعههای دادهای مبتنی بر وب مصنوعی و انتخابشده گردآوری شدهاند. همچنین، یک مرحله یادگیری تقویتی با تمرکز بر 6,400 مسئله ریاضی، تواناییهای استدلالی مدل را بهبود بخشیده است.
این مدل تحت مجوز MIT منتشر شده است، که استفاده از آن را برای برنامههای تجاری و سازمانی گسترده، و همچنین بهینهسازی و تقطیر بدون هیچ محدودیتی ممکن میسازد. Phi-4-reasoning-plus با فریمورکهای شناختهشدهای چون Hugging Face Transformers، vLLM، llama.cpp و Ollama سازگاری دارد. مایکروسافت همچنین توصیههایی دقیق در مورد پارامترهای استنتاج و فرمتبندی درخواستهای سیستمی ارائه میدهد تا به توسعهدهندگان کمک کند از این مدل به بهترین شکل استفاده کنند.
این مدل نشاندهنده تأکید روزافزون مایکروسافت بر آموزش مدلهای کوچکتر است که قادر به رقابت با سیستمهای بزرگتر از نظر عملکرد هستند. بهعنوان مثال، Phi-4-reasoning-plus در آزمون ریاضی AIME 2025 توانسته است دقت بالاتری نسبت به مدلهای بزرگتر نظیر DeepSeek-R1-Distill-70B ارائه دهد، بهطوریکه در پاسخ به 30 سوال، در اولین تلاش درصد قبولی بیشتری را به دست آورده است.
استراتژی آموزشی مایکروسافت، که بر اساس تحلیل دادهمحور قرار دارد، شامل استفاده از ترکیبی از خطوط استدلالی مصنوعی و درخواستهای باکیفیت پالایششده است. نوآوریهای کلیدی در این روش آموزشی، استفاده از خروجیهای استدلال ساختاریافته است که با توکنهای خاص مشخص شدهاند. این رویکرد به تفکیک مراحل میانی استدلال از پاسخ نهایی کمک کرده و به افزایش شفافیت و هماهنگی در حل مسائل طولانی میانجامد.
مدل Phi-4-reasoning-plus بهویژه برای کاربردهایی که نیاز به استدلال با کیفیت بالا تحت محدودیتهای حافظه یا تأخیر دارند، طراحی شده است. این مدل از طول زمینه 32,000 توکن بهطور پیشفرض پشتیبانی میکند و در آزمایشها با ورودیهای تا 64,000 توکن نیز پایدار عمل کرده است. بهترین کاربرد آن در محیطهای گفتگو محور است و عملکرد بهینهتری با درخواست سیستمی که بهطور واضح آن را ملزم به استدلال مرحله به مرحله قبل از ارائه پاسخ میکند، دارد.
مایکروسافت، Phi-4-reasoning-plus را بهعنوان ابزاری تحقیقاتی و جزئی از سیستمهای تولیدی هوش مصنوعی معرفی کرده و از توسعهدهندگان خواسته است قبل از پیادهسازی مدل در محیطهای با ریسک بالا یا تنظیمشده، به دقت عملکرد، ایمنی و انصاف را بررسی کنند. این مدل به طور جامع تحت ارزیابی های ایمنی قرار گرفته و آزمایشهای متعادلساز در زمینههای حساس توسط تیمهای داخلی مایکروسافت انجام شده است.
بهطور کلی، انتشار Phi-4-reasoning-plus نشاندهنده آن است که با استفاده از دادهها و تکنیکهای آموزشی بهدقت انتخابشده، مدلهای کوچک قادر به دستیابی به عملکرد استدلال قویتری هستند و دسترسی باز و دموکراتیک به این فناوری را فراهم میکنند. این تحولات در دنیای هوش مصنوعی بار دیگر تأکید میکنند که در عصر جدید، اندازه مدل کمتر از گذشته اهمیت دارد و تواناییهای ارائه شده میتواند منافع زیادی برای شرکتها و سازمانها بههمراه داشته باشد.