به تازگی استارتاپ چینی MiniMax، که به خاطر مدل ویدئویی واقع‌گرایانه خود به نام Hailuo در غرب شناخته شده، مدل زبان جدید خود به نام MiniMax-M1 را به صورت متن‌باز تحت مجوز Apache 2.0 عرضه کرده است. این موضوع خبر خوبی برای شرکت‌ها و توسعه‌دهندگان است، چرا که امکان استفاده از این مدل برای کاربردهای تجاری و تغییر آن بدون هیچ‌گونه محدودیت یا پرداختی فراهم شده است.

مدل MiniMax-M1 با ویژگی‌های برجسته‌ای در زمینه استدلال با متن‌های طولانی، استفاده از ابزارهای هوشمند و بهره‌وری بالای محاسباتی برتری دارد. این مدل به طور هم‌زمان قابلیت پردازش ۱ میلیون توکن ورودی و تا ۸۰ هزار توکن خروجی را دارد، که آن را به یکی از جامع‌ترین مدل‌ها برای انجام وظایف استدلال با متن‌های طولانی تبدیل می‌کند. به عبارت دیگر، پنجره «متن» در این مدل به ما اجازه می‌دهد تا حجم زیادی از اطلاعات را در یک تعامل مورد بررسی قرار دهیم. به عنوان مثال، مدل GPT-4 اوپن‌ای‌آی تنها می‌تواند ۱۲۸ هزار توکن را در یک بار پردازش کند، در حالی که MiniMax-M1 توانایی پردازش یک مجموعه کوچک از اطلاعات یا مجموعه‌ای از کتاب‌ها را دارد.

این مدل همچنین با استفاده از یادگیری تقویتی و یک معماری هیبریدی Mixture-of-Experts (MoE) و مکانیزم توجه پیشرفته طراحی شده است که هزینه‌های استنتاج را کاهش می‌دهد. بر اساس گزارش‌های فنی، MiniMax-M1 تنها ۲۵ درصد از عملیات محاسباتی سکه‌ای (FLOPs) مورد نیاز برای مدل DeepSeek R1 را مصرف می‌کند.

مدل MiniMax-M1 در دو نسخه عرضه شده است: MiniMax-M1-40k و MiniMax-M1-80k، که به طول خروجی یا «بودجه تفکری» آن‌ها اشاره دارد. MiniMax با اعلام اینکه هزینه آموزش این مدل تنها ۵۳۴ هزار و ۷۰۰ دلار بوده، عملاً یک مدل LLM در خط مقدم به حساب می‌آید، در حالی که هزینه‌های آموزشی مدل‌های دیگر مانند R1 از DeepSeek به ۵ تا ۶ میلیون دلار و GPT-4 به بیش از ۱۰۰ میلیون دلار رسیده است.

MiniMax-M1 به طور موفقیت‌آمیزی در مجموعه‌ای از آزمون‌های benchmarking معتبر که شامل استدلال پیشرفته، مهندسی نرم‌افزار و قابلیت‌های استفاده از ابزارها هستند، ارزیابی شده است. بر اساس آزمون AIME 2024، مدل M1-80k دقت ۸۶ درصد را به دست آورده است.

از نظر پیاده‌سازی، MiniMax توصیه می‌کند از vLLM به عنوان بک‌اند سرویس‌دهی استفاده شود و گزینه‌های دیگری نیز با استفاده از کتابخانه Transformers ارائه می‌شود. MiniMax-M1 همچنین شامل قابلیت‌های فراخوانی توابع ساختاری و API چت‌بات است که شامل جستجوی آنلاین، تولید ویدیو و تصویر، و شبیه‌سازی سخنرانی و کلاهبرداری صدا می‌باشد.

این دستاوردها دلیل خوبی برای علاقه‌مندی سازمان‌ها به استفاده از MiniMax-M1 به عنوان مدلی پایه برای توسعه برنامه‌های نسل بعدی با نیازهای عمیق استدلال و درک ورودی طولانی فراهم می‌کند. به طور کلی، MiniMax-M1 گزینه‌ای منعطف برای سازمان‌هاست که به دنبال افزایش توانایی‌های پیشرفته AI و کاهش هزینه‌ها می‌باشند.

ما در حال پیگیری دیگر اخبار از MiniMax در طول هفته خواهیم بود. منتظر خبرهای بیشتری باشید!

تبدیل متن‌های فارسی به صوت طبیعی و روان

دیدگاه‌ خود را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

اسکرول به بالا