به تازگی استارتاپ چینی MiniMax، که به خاطر مدل ویدئویی واقعگرایانه خود به نام Hailuo در غرب شناخته شده، مدل زبان جدید خود به نام MiniMax-M1 را به صورت متنباز تحت مجوز Apache 2.0 عرضه کرده است. این موضوع خبر خوبی برای شرکتها و توسعهدهندگان است، چرا که امکان استفاده از این مدل برای کاربردهای تجاری و تغییر آن بدون هیچگونه محدودیت یا پرداختی فراهم شده است.
مدل MiniMax-M1 با ویژگیهای برجستهای در زمینه استدلال با متنهای طولانی، استفاده از ابزارهای هوشمند و بهرهوری بالای محاسباتی برتری دارد. این مدل به طور همزمان قابلیت پردازش ۱ میلیون توکن ورودی و تا ۸۰ هزار توکن خروجی را دارد، که آن را به یکی از جامعترین مدلها برای انجام وظایف استدلال با متنهای طولانی تبدیل میکند. به عبارت دیگر، پنجره «متن» در این مدل به ما اجازه میدهد تا حجم زیادی از اطلاعات را در یک تعامل مورد بررسی قرار دهیم. به عنوان مثال، مدل GPT-4 اوپنایآی تنها میتواند ۱۲۸ هزار توکن را در یک بار پردازش کند، در حالی که MiniMax-M1 توانایی پردازش یک مجموعه کوچک از اطلاعات یا مجموعهای از کتابها را دارد.
این مدل همچنین با استفاده از یادگیری تقویتی و یک معماری هیبریدی Mixture-of-Experts (MoE) و مکانیزم توجه پیشرفته طراحی شده است که هزینههای استنتاج را کاهش میدهد. بر اساس گزارشهای فنی، MiniMax-M1 تنها ۲۵ درصد از عملیات محاسباتی سکهای (FLOPs) مورد نیاز برای مدل DeepSeek R1 را مصرف میکند.
مدل MiniMax-M1 در دو نسخه عرضه شده است: MiniMax-M1-40k و MiniMax-M1-80k، که به طول خروجی یا «بودجه تفکری» آنها اشاره دارد. MiniMax با اعلام اینکه هزینه آموزش این مدل تنها ۵۳۴ هزار و ۷۰۰ دلار بوده، عملاً یک مدل LLM در خط مقدم به حساب میآید، در حالی که هزینههای آموزشی مدلهای دیگر مانند R1 از DeepSeek به ۵ تا ۶ میلیون دلار و GPT-4 به بیش از ۱۰۰ میلیون دلار رسیده است.
MiniMax-M1 به طور موفقیتآمیزی در مجموعهای از آزمونهای benchmarking معتبر که شامل استدلال پیشرفته، مهندسی نرمافزار و قابلیتهای استفاده از ابزارها هستند، ارزیابی شده است. بر اساس آزمون AIME 2024، مدل M1-80k دقت ۸۶ درصد را به دست آورده است.
از نظر پیادهسازی، MiniMax توصیه میکند از vLLM به عنوان بکاند سرویسدهی استفاده شود و گزینههای دیگری نیز با استفاده از کتابخانه Transformers ارائه میشود. MiniMax-M1 همچنین شامل قابلیتهای فراخوانی توابع ساختاری و API چتبات است که شامل جستجوی آنلاین، تولید ویدیو و تصویر، و شبیهسازی سخنرانی و کلاهبرداری صدا میباشد.
این دستاوردها دلیل خوبی برای علاقهمندی سازمانها به استفاده از MiniMax-M1 به عنوان مدلی پایه برای توسعه برنامههای نسل بعدی با نیازهای عمیق استدلال و درک ورودی طولانی فراهم میکند. به طور کلی، MiniMax-M1 گزینهای منعطف برای سازمانهاست که به دنبال افزایش تواناییهای پیشرفته AI و کاهش هزینهها میباشند.
ما در حال پیگیری دیگر اخبار از MiniMax در طول هفته خواهیم بود. منتظر خبرهای بیشتری باشید!