عنوان: MiniMax M2.5؛ مدل زبان چینی که هوش مصنوعی سطح بالا را «خیلی ارزان» کرد — فرصتی برای تبدیل AI به کارگر سازمانی
MiniMax، استارتآپ چینی مستقر در شانگهای، امروز از مدل زبان جدید خود با نام M2.5 در دو نسخه رونمایی کرد؛ مدلی که ادعا میشود با هزینهای بهمراتب کمتر از رقبا، عملکردی نزدیک به رهبران بازار ارائه میدهد و ممکن است نحوه استفاده شرکتها از هوش مصنوعی را تغییر دهد. اگرچه این شرکت از عنوان «متنباز» برای M2.5 استفاده کرده، اما وزنهای مدل، کد و جزئیات مجوز انتشار هنوز در دسترس عموم قرار نگرفتهاند؛ با این حال قیمتگذاری پایین API و سرویسهای شرکای MiniMax توجهها را جلب کرده است.
چرا M2.5 مهم است؟
– کاهش چشمگیر هزینه: MiniMax ادعا میکند هزینه اجرای وظایف پیشرفته با M2.5 تا حدود ۹۵٪ کاهش یافته است، بهطوری که هزینه سرانگشتی هر «کار» با این مدل به ترتیب بسیار کمتر از مدلهایی همچون Claude Opus 4.6 برآورد میشود.
– تغییر پارادایم از «چتبات» به «عامل هوشمند»: با کاهش هزینهها، استفاده از مدلهای هوشمند برای انجام وظایف طولانیمدت و اتوماتیک (agentic workflows) مقرونبهصرفه میشود و به جای پرسش و پاسخ ساده، سیستمهایی ساخته میشوند که بهصورت خودکار کدنویسی، تحقیق و سازماندهی پروژهها را انجام میدهند.
– کاربردهای سازمانی: MiniMax میگوید مدل در تولید فایلهای Word، Excel و PowerPoint، مدلسازی مالی و کارهای تخصصی حوزههایی مانند حقوق و علوم اجتماعی بهخوبی عمل میکند و برای هماهنگی با استانداردهای حرفهای، با افراد ارشد صنعتهای مالی، حقوق و علوم اجتماعی همکاری داشته است.
ویژگیهای فنی کلیدی
– معماری Mixture of Experts (MoE): بهجای فعالسازی تمام ۲۳۰ میلیارد پارامتر برای هر توکن، M2.5 تنها حدود ۱۰ میلیارد پارامتر را «فعال» میکند. این رویکرد باعث میشود مدل ترکیبی از عمق استدلال یک مدل بسیار بزرگ و چابکی یک مدل کوچکتر را داشته باشد.
– فریمورک آموزش تقویتی اختصاصی «Forge»: MiniMax میگوید برای آموزش M2.5 از یک چارچوب RL اختصاصی به نام Forge استفاده کرده که به مدل اجازه میدهد در هزاران محیط شبیهسازیشده ابزارها را تمرین کند و از «محیطهای واقعینما» یاد بگیرد. مهندسین شرکت گفتهاند آموزش نهایی حدود دو ماه طول کشیده است.
– پایداری در آموزش با CISPO: برای جلوگیری از نوسانات و «بیشاصلاح» در طول فرآیند یادگیری، MiniMax روشی ریاضیاتی به نام CISPO (Clipping Importance Sampling Policy Optimization) را معرفی کرده که به مدل کمک میکند رفتارهای عملی و برنامهمحور (آنچه شرکت آن را «Architect Mindset» مینامد) را یاد بگیرد—یعنی پیش از نوشتن کد، ساختار و مسیر راهحل را برنامهریزی کند.
نتایج بنچمارک و عملکرد
MiniMax M2.5 در چند بنچمارک کلیدی عملکرد قابل توجهی نشان داده است:
– SWE-Bench Verified: 80.2٪ (موازی با سرعت Claude Opus 4.6)
– BrowseComp: 76.3٪ (پیشرو در جستوجو و استفاده از ابزارها)
– Multi-SWE-Bench: 51.3٪ (SOTA در کدنویسی چندزبانه)
– BFCL (Tool Calling): 76.8٪ (دقت بالا در گردشکارهای عاملمحور)
علاوه بر این، M2.5 در مدلسازی مالی (MEWC) امتیازی در حدود 74.4٪ کسب کرده که نشان میدهد در پردازش دانش ضمنی صنایع تخصصی نیز قابل اتکاست.
قیمتگذاری و نسخهها
MiniMax مدل M2.5 را در دو نسخه برای استفاده تولیدی و حجم بالا عرضه کرده:
– M2.5-Lightning (بهینهشده برای سرعت): ۱۰۰ توکن در ثانیه؛ هزینه: ۰.۳۰ دلار بهازای ۱ میلیون توکن ورودی و ۲.۴۰ دلار بهازای ۱ میلیون توکن خروجی.
– Standard M2.5 (بهینهشده برای هزینه): ۵۰ توکن در ثانیه؛ هزینه: ۰.۱۵ دلار بهازای ۱ میلیون توکن ورودی و ۱.۲۰ دلار بهازای ۱ میلیون توکن خروجی.
طبق ادعای شرکت، این قیمتها باعث میشوند که اجرای چند عامل (Agents) بهطور مداوم برای یک سال بهطور قابل توجهی ارزانتر از رقبا باشد (مثلاً چهار «عامل» پیوسته برای یک سال حدود ۱۰٬۰۰۰ دلار برآورد شده است)، رقمی که آن را تا یکدهم یا یکبیستم هزینه مدلهای پیشرفتهای مانند GPT-5 یا Claude 4.6 قرار میدهد.
پیادهسازی داخلی و پیامدهای عملیاتی
MiniMax اعلام کرده که در حال حاضر حدود ۳۰٪ از تمام وظایف در دفتر مرکزی با کمک M2.5 انجام میشود و تقریباً ۸۰٪ از کدهای جدید متعهدشده توسط این مدل تولید میشود. برای رهبران فنی، این یعنی فشار به بهینهسازی دقیق پرامپت برای کاهش هزینه کاهش مییابد و میتوان مدلهای با زمینهسازی و استدلال بالا را برای انجام کارهای روزمره و تخصصی بهکار گرفت. افزایش سرعت تا حدود ۳۷٪ در زمان کلی اجرای وظایف نیز به بهبود خطوط لوله عاملمحور برای کاربردهای بلادرنگ کمک میکند.
ملاحظات حقوقی و نگرانیها
هرچند MiniMax مدل را «متنباز» توصیف کرده، اما تا زمان انتشار وزنها، کد و شرایط دقیق مجوز نمیتوان درباره میزان آزادی استفاده، قابلیت اجرا روی زیرساختهای داخلی سازمانها و پیامدهای حریم خصوصی قضاوت قطعی کرد. سازمانها باید تا روشن شدن جزئیات مجوز و انتشار کامل مدل، احتیاط لازم را رعایت کنند—بهویژه در کاربردهای حساس مانند امور مالی و حقوقی.
جمعبندی
معرفی M2.5 توسط MiniMax نشاندهنده جهشی در جهت مقرونبهصرفهسازی هوش مصنوعی سطح بالا است؛ رویکرد Mixture of Experts همراه با آموزش تقویتی در محیطهای شبیهسازیشده امکان ارائه عملکرد نزدیک به مدلهای برجسته را با هزینهای بسیار پایینتر فراهم کرده است. اگر انتشار کامل کد و وزنها همراه با مجوز شفاف صورت بگیرد، M2.5 میتواند پوششدهی وسیعی در محصولات و فرآیندهای سازمانی ایجاد کند و زمینه را برای استفاده گستردهتر از «عاملهای هوشمند» مهیا سازد. در غیر این صورت، باید آن را یک گام فنی قابلتوجه دانست که هنوز نیازمند بررسی دقیقتر در مواردی مانند شفافیت و حقوق استفاده است.
