خبر: انتشار مدل جدید هوش مصنوعی Phi-4-reasoning-plus توسط مایکروسافت

در روزهای اخیر، مایکروسافت از انتشار مدل زبان جدیدی به نام Phi-4-reasoning-plus خبر داد که به‌طور خاص برای انجام وظایف نیازمند استدلال عمیق و ساختارمند طراحی شده است. این مدل با بهره‌گیری از ساختار مدل پیشین Phi-4، شامل آموزش نظارت شده و یادگیری تقویتی می‌باشد و عملکرد بهتری را در زمینه‌های ریاضی، علوم، برنامه‌نویسی و وظایف مبتنی بر منطق ارائه می‌دهد.

مدل Phi-4-reasoning-plus دارای 14 میلیارد پارامتر و بر پایه تکنیک‌های رمزگذاری فقط از نوع ترانسفورمر می‌باشد و بر کیفیت به جای مقیاس تأکید دارد. فرآیند آموزش این مدل شامل 16 میلیارد توکن است که حدود 8.3 میلیارد از آن‌ها منحصر به فرد هستند و از مجموعه‌های داده‌ای مبتنی بر وب مصنوعی و انتخاب‌شده گردآوری شده‌اند. همچنین، یک مرحله یادگیری تقویتی با تمرکز بر 6,400 مسئله ریاضی، توانایی‌های استدلالی مدل را بهبود بخشیده است.

این مدل تحت مجوز MIT منتشر شده است، که استفاده از آن را برای برنامه‌های تجاری و سازمانی گسترده، و همچنین بهینه‌سازی و تقطیر بدون هیچ محدودیتی ممکن می‌سازد. Phi-4-reasoning-plus با فریم‌ورک‌های شناخته‌شده‌ای چون Hugging Face Transformers، vLLM، llama.cpp و Ollama سازگاری دارد. مایکروسافت همچنین توصیه‌هایی دقیق در مورد پارامترهای استنتاج و فرمت‌بندی درخواست‌های سیستمی ارائه می‌دهد تا به توسعه‌دهندگان کمک کند از این مدل به بهترین شکل استفاده کنند.

این مدل نشان‌دهنده تأکید روزافزون مایکروسافت بر آموزش مدل‌های کوچک‌تر است که قادر به رقابت با سیستم‌های بزرگ‌تر از نظر عملکرد هستند. به‌عنوان مثال، Phi-4-reasoning-plus در آزمون ریاضی AIME 2025 توانسته است دقت بالاتری نسبت به مدل‌های بزرگتر نظیر DeepSeek-R1-Distill-70B ارائه دهد، به‌طوری‌که در پاسخ به 30 سوال، در اولین تلاش درصد قبولی بیشتری را به دست آورده است.

استراتژی آموزشی مایکروسافت، که بر اساس تحلیل داده‌محور قرار دارد، شامل استفاده از ترکیبی از خطوط استدلالی مصنوعی و درخواست‌های باکیفیت پالایش‌شده است. نوآوری‌های کلیدی در این روش آموزشی، استفاده از خروجی‌های استدلال ساختاریافته است که با توکن‌های خاص مشخص شده‌اند. این رویکرد به تفکیک مراحل میانی استدلال از پاسخ نهایی کمک کرده و به افزایش شفافیت و هماهنگی در حل مسائل طولانی می‌انجامد.

مدل Phi-4-reasoning-plus به‌ویژه برای کاربردهایی که نیاز به استدلال با کیفیت بالا تحت محدودیت‌های حافظه یا تأخیر دارند، طراحی شده است. این مدل از طول زمینه 32,000 توکن به‌طور پیش‌فرض پشتیبانی می‌کند و در آزمایش‌ها با ورودی‌های تا 64,000 توکن نیز پایدار عمل کرده است. بهترین کاربرد آن در محیط‌های گفتگو محور است و عملکرد بهینه‌تری با درخواست سیستمی که به‌طور واضح آن را ملزم به استدلال مرحله به مرحله قبل از ارائه پاسخ می‌کند، دارد.

مایکروسافت، Phi-4-reasoning-plus را به‌عنوان ابزاری تحقیقاتی و جزئی از سیستم‌های تولیدی هوش مصنوعی معرفی کرده و از توسعه‌دهندگان خواسته است قبل از پیاده‌سازی مدل در محیط‌های با ریسک بالا یا تنظیم‌شده، به دقت عملکرد، ایمنی و انصاف را بررسی کنند. این مدل به طور جامع تحت ارزیابی‌ های ایمنی قرار گرفته و آزمایش‌های متعادل‌ساز در زمینه‌های حساس توسط تیم‌های داخلی مایکروسافت انجام شده است.

به‌طور کلی، انتشار Phi-4-reasoning-plus نشان‌دهنده آن است که با استفاده از داده‌ها و تکنیک‌های آموزشی به‌دقت انتخاب‌شده، مدل‌های کوچک قادر به دستیابی به عملکرد استدلال قوی‌تری هستند و دسترسی باز و دموکراتیک به این فناوری را فراهم می‌کنند. این تحولات در دنیای هوش مصنوعی بار دیگر تأکید می‌کنند که در عصر جدید، اندازه مدل کمتر از گذشته اهمیت دارد و توانایی‌های ارائه شده می‌تواند منافع زیادی برای شرکت‌ها و سازمان‌ها به‌همراه داشته باشد.

چت با هوش مصنوعی

دیدگاه‌ خود را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

اسکرول به بالا