Multiverse Computing با مدل‌های فشرده، اجرای مدل‌های بزرگ زبان را مقرون‌به‌صرفه‌تر می‌کند

شرکت اسپانیایی Multiverse Computing راه‌حلی برای یکی از چالش‌های اصلی مدل‌های بزرگ زبان (Large Language Models) ارائه کرده است: اندازه و هزینه بالای استقرار عملیاتی. این شرکت که مرکز آن در ناحیه باسک اسپانیا قرار دارد، با فناوری فشرده‌سازی جدیدی به نام CompactifAI تلاش می‌کند شکاف بین عملکرد مدل‌های مرزدانش و توان مالی شرکت‌ها برای به‌کارگیری آن‌ها را کاهش دهد.

CompactifAI چیست و چه مزیتی دارد؟
CompactifAI فناوری فشرده‌سازی مبتنی بر ایده‌هایی الهام‌گرفته از محاسبات کوانتومی معرفی شده توسط Multiverse است که هدف آن کاهش حجم مدل‌ها بدون از دست رفتن قابل‌توجه در دقت و کارایی است. نتیجه این فرایند مدل‌هایی با مصرف حافظه و تأخیر کمتر است که برای استقرار در محیط‌های سازمانی و کاربردهای حساس به هزینهِ استنتاج مناسب‌ترند.

HyperNova 60B 2602: مدل فشرده و در دسترس توسعه‌دهندگان
نسخه جدید مدل فشرده‌شده این شرکت با نام HyperNova 60B 2602 اکنون به‌صورت رایگان در پلتفرم Hugging Face در دسترس توسعه‌دهندگان قرار دارد. این مدل با حجم حدود 32 گیگابایت تقریباً نصف حجم مدل پایه‌ای خود یعنی gpt-oss-120b ارزیابی‌شده و طبق ادعای Multiverse، با کاهش مصرف حافظه و تأخیر، تقریباً به همان میزان دقت و توان محاسباتی را ارائه می‌دهد. بهبودهای نسخه 2602 به‌ویژه در پشتیبانی از فراخوانی ابزار (tool calling) و کدنویسی عامل‌محور (agentic coding) محسوس است؛ دو حوزه‌ای که هزینه‌های استنتاج می‌توانند بالا باشند و نیازمند پاسخ‌های سریع و کارآمد هستند.

کاربردها و مزایای عملی فشرده‌سازی مدل‌ها
– کاهش هزینه‌های استقرار و نگه‌داری مدل‌ها برای شرکت‌ها و مؤسسات.
– امکان استقرار در زیرساخت‌های با حافظه محدود یا نزدیک به لبه (edge)؛ که به‌ویژه در برنامه‌های زمان‌حقیقی مهم است.
– کاهش تأخیر در پاسخ‌دهی و بهبود تجربه کاربری در سامانه‌های مبتنی بر عامل‌ها و فراخوانی ابزار.

رقابت اروپایی و چشم‌انداز تجاری
Multiverse رقیبانی از جمله Mistral AI را در برابر خود می‌بیند؛ البته هم‌زمان با رقابت تکنولوژیک، این شرکت‌ها اشتراکاتی هم دارند، از جمله گسترش فعالیت فراملی (دفاتر در ایالات متحده، کانادا و اروپا) و جذب مشتریان سازمانی. Multiverse مشتریانی همچون Iberdrola، Bosch و بانک کانادا را اعلام کرده است.

در حوزه مالی نیز شایعاتی درباره تلاش این استارتاپ برای جذب سرمایه تازه به مبلغ حدود 500 میلیون یورو و ارزشیابی بیش از 1.5 میلیارد یورو مطرح شده است؛ شرکت تأیید کرده که گفتگوهای فعالی با سرمایه‌گذاران در جریان است اما در مورد رقم نهایی یا ارزش‌گذاری رسمی اظهارنظر نکرده است. گزارش‌هایی نیز از رسیدن درآمد سالانه تکرارپذیر (ARR) این شرکت به حدود 100 میلیون یورو در ژانویه حکایت دارند که اگر تأیید شود، نشان‌دهنده رشد سریع در مقیاس‌های اروپایی خواهد بود (در مقایسه با ARR عظیم OpenAI یا رشد قابل‌توجه Mistral).

ابعاد ژئوپلیتیک و حاکمیت داده‌ها
Multiverse خود را به‌عنوان تأمین‌کننده «راه‌حل‌های حاکمیتی در لایه‌های مختلفِ پشته هوش مصنوعی» معرفی می‌کند؛ موضعی که در بازارهای اروپایی و دولت‌ها اهمیت دارد و به همکاری‌هایی از قبیل پروژه‌ای با دولت منطقه‌ای آراگون (Aragón) و حمایت‌هایی از سوی آژانس تبدیل فناوری اسپانیا (SETT) منجر شده است. حمایت‌های منطقه‌ای از ناحیه باسک نیز به این شرکت کمک کرده و این منطقه ممکن است به‌زودی اولین یونیکورن خود را به‌دست آورد.

چشم‌انداز نهایی
فشرده‌سازی مدل‌ها مانند کاری که Multiverse با CompactifAI و HyperNova انجام داده، می‌تواند گسترش استفاده از مدل‌های بزرگ زبان را در شرکت‌ها و سازمان‌هایی که توان مالی یا زیرساختی محدودی دارند تسهیل کند. دسترسی رایگان توسعه‌دهندگان به نمونه‌های فشرده‌شده و برنامه‌های متن‌باز آتی (اعلام‌شده برای 2026) می‌تواند به شکل‌گیری اکوسیستمی کمک کند که گزینه‌های بیشتر و متنوع‌تری را برای استقرار هوش مصنوعی در اروپا و فراتر از آن فراهم آورد.

ویرایش تصویر با هوش مصنوعی

دیدگاه‌ خود را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

اسکرول به بالا