MiniMax M2.5 و M2.5 Lightning متن‌باز: عملکردی نزدیک به پیشرفته‌ترین مدل‌ها با قیمت یک‌بیستم Claude Opus 4.6

عنوان: MiniMax M2.5؛ مدل زبان چینی که هوش مصنوعی سطح بالا را «خیلی ارزان» کرد — فرصتی برای تبدیل AI به کارگر سازمانی

MiniMax، استارت‌آپ چینی مستقر در شانگهای، امروز از مدل زبان جدید خود با نام M2.5 در دو نسخه رونمایی کرد؛ مدلی که ادعا می‌شود با هزینه‌ای به‌مراتب کمتر از رقبا، عملکردی نزدیک به رهبران بازار ارائه می‌دهد و ممکن است نحوه استفاده شرکت‌ها از هوش مصنوعی را تغییر دهد. اگرچه این شرکت از عنوان «متن‌باز» برای M2.5 استفاده کرده، اما وزن‌های مدل، کد و جزئیات مجوز انتشار هنوز در دسترس عموم قرار نگرفته‌اند؛ با این حال قیمت‌گذاری پایین API و سرویس‌های شرکای MiniMax توجه‌ها را جلب کرده است.

چرا M2.5 مهم است؟
– کاهش چشمگیر هزینه: MiniMax ادعا می‌کند هزینه اجرای وظایف پیشرفته با M2.5 تا حدود ۹۵٪ کاهش یافته است، به‌طوری که هزینه سرانگشتی هر «کار» با این مدل به ترتیب بسیار کمتر از مدل‌هایی همچون Claude Opus 4.6 برآورد می‌شود.
– تغییر پارادایم از «چت‌بات» به «عامل هوشمند»: با کاهش هزینه‌ها، استفاده از مدل‌های هوشمند برای انجام وظایف طولانی‌مدت و اتوماتیک (agentic workflows) مقرون‌به‌صرفه می‌شود و به جای پرسش و پاسخ ساده، سیستم‌هایی ساخته می‌شوند که به‌صورت خودکار کدنویسی، تحقیق و سازمان‌دهی پروژه‌ها را انجام می‌دهند.
– کاربردهای سازمانی: MiniMax می‌گوید مدل در تولید فایل‌های Word، Excel و PowerPoint، مدل‌سازی مالی و کارهای تخصصی حوزه‌هایی مانند حقوق و علوم اجتماعی به‌خوبی عمل می‌کند و برای هماهنگی با استانداردهای حرفه‌ای، با افراد ارشد صنعت‌های مالی، حقوق و علوم اجتماعی همکاری داشته است.

ویژگی‌های فنی کلیدی
– معماری Mixture of Experts (MoE): به‌جای فعال‌سازی تمام ۲۳۰ میلیارد پارامتر برای هر توکن، M2.5 تنها حدود ۱۰ میلیارد پارامتر را «فعال» می‌کند. این رویکرد باعث می‌شود مدل ترکیبی از عمق استدلال یک مدل بسیار بزرگ و چابکی یک مدل کوچک‌تر را داشته باشد.
– فریم‌ورک آموزش تقویتی اختصاصی «Forge»: MiniMax می‌گوید برای آموزش M2.5 از یک چارچوب RL اختصاصی به نام Forge استفاده کرده که به مدل اجازه می‌دهد در هزاران محیط شبیه‌سازی‌شده ابزارها را تمرین کند و از «محیط‌های واقعی‌نما» یاد بگیرد. مهندسین شرکت گفته‌اند آموزش نهایی حدود دو ماه طول کشیده است.
– پایداری در آموزش با CISPO: برای جلوگیری از نوسانات و «بیش‌اصلاح» در طول فرآیند یادگیری، MiniMax روشی ریاضیاتی به نام CISPO (Clipping Importance Sampling Policy Optimization) را معرفی کرده که به مدل کمک می‌کند رفتارهای عملی و برنامه‌محور (آنچه شرکت آن را «Architect Mindset» می‌نامد) را یاد بگیرد—یعنی پیش از نوشتن کد، ساختار و مسیر راه‌حل را برنامه‌ریزی کند.

نتایج بنچمارک و عملکرد
MiniMax M2.5 در چند بنچمارک کلیدی عملکرد قابل توجهی نشان داده است:
– SWE-Bench Verified: 80.2٪ (موازی با سرعت Claude Opus 4.6)
– BrowseComp: 76.3٪ (پیشرو در جست‌وجو و استفاده از ابزارها)
– Multi-SWE-Bench: 51.3٪ (SOTA در کدنویسی چندزبانه)
– BFCL (Tool Calling): 76.8٪ (دقت بالا در گردش‌کارهای عامل‌محور)
علاوه بر این، M2.5 در مدل‌سازی مالی (MEWC) امتیازی در حدود 74.4٪ کسب کرده که نشان می‌دهد در پردازش دانش ضمنی صنایع تخصصی نیز قابل اتکاست.

قیمت‌گذاری و نسخه‌ها
MiniMax مدل M2.5 را در دو نسخه برای استفاده تولیدی و حجم بالا عرضه کرده:
– M2.5-Lightning (بهینه‌شده برای سرعت): ۱۰۰ توکن در ثانیه؛ هزینه: ۰.۳۰ دلار به‌ازای ۱ میلیون توکن ورودی و ۲.۴۰ دلار به‌ازای ۱ میلیون توکن خروجی.
– Standard M2.5 (بهینه‌شده برای هزینه): ۵۰ توکن در ثانیه؛ هزینه: ۰.۱۵ دلار به‌ازای ۱ میلیون توکن ورودی و ۱.۲۰ دلار به‌ازای ۱ میلیون توکن خروجی.
طبق ادعای شرکت، این قیمت‌ها باعث می‌شوند که اجرای چند عامل (Agents) به‌طور مداوم برای یک سال به‌طور قابل توجهی ارزان‌تر از رقبا باشد (مثلاً چهار «عامل» پیوسته برای یک سال حدود ۱۰٬۰۰۰ دلار برآورد شده است)، رقمی که آن را تا یک‌دهم یا یک‌بیستم هزینه مدل‌های پیشرفته‌ای مانند GPT-5 یا Claude 4.6 قرار می‌دهد.

پیاده‌سازی داخلی و پیامدهای عملیاتی
MiniMax اعلام کرده که در حال حاضر حدود ۳۰٪ از تمام وظایف در دفتر مرکزی با کمک M2.5 انجام می‌شود و تقریباً ۸۰٪ از کدهای جدید متعهدشده توسط این مدل تولید می‌شود. برای رهبران فنی، این یعنی فشار به بهینه‌سازی دقیق پرامپت برای کاهش هزینه کاهش می‌یابد و می‌توان مدل‌های با زمینه‌سازی و استدلال بالا را برای انجام کارهای روزمره و تخصصی به‌کار گرفت. افزایش سرعت تا حدود ۳۷٪ در زمان کلی اجرای وظایف نیز به بهبود خطوط لوله عامل‌محور برای کاربردهای بلادرنگ کمک می‌کند.

ملاحظات حقوقی و نگرانی‌ها
هرچند MiniMax مدل را «متن‌باز» توصیف کرده، اما تا زمان انتشار وزن‌ها، کد و شرایط دقیق مجوز نمی‌توان درباره میزان آزادی استفاده، قابلیت اجرا روی زیرساخت‌های داخلی سازمان‌ها و پیامدهای حریم خصوصی قضاوت قطعی کرد. سازمان‌ها باید تا روشن شدن جزئیات مجوز و انتشار کامل مدل، احتیاط لازم را رعایت کنند—به‌ویژه در کاربردهای حساس مانند امور مالی و حقوقی.

جمع‌بندی
معرفی M2.5 توسط MiniMax نشان‌دهنده جهشی در جهت مقرون‌به‌صرفه‌سازی هوش مصنوعی سطح بالا است؛ رویکرد Mixture of Experts همراه با آموزش تقویتی در محیط‌های شبیه‌سازی‌شده امکان ارائه عملکرد نزدیک به مدل‌های برجسته را با هزینه‌ای بسیار پایین‌تر فراهم کرده است. اگر انتشار کامل کد و وزن‌ها همراه با مجوز شفاف صورت بگیرد، M2.5 می‌تواند پوشش‌دهی وسیعی در محصولات و فرآیندهای سازمانی ایجاد کند و زمینه را برای استفاده گسترده‌تر از «عامل‌های هوشمند» مهیا سازد. در غیر این صورت، باید آن را یک گام فنی قابل‌توجه دانست که هنوز نیازمند بررسی دقیق‌تر در مواردی مانند شفافیت و حقوق استفاده است.

مشاور دیجیتال هوشمند

MiniMax M2.5 و M2.5 Lightning متن‌باز: عملکردی نزدیک به پیشرفته‌ترین مدل‌ها با قیمت یک‌بیستم Claude Opus 4.6

دیدگاه‌ خود را بنویسید لغو پاسخ