Multiverse Computing با مدلهای فشرده، اجرای مدلهای بزرگ زبان را مقرونبهصرفهتر میکند
شرکت اسپانیایی Multiverse Computing راهحلی برای یکی از چالشهای اصلی مدلهای بزرگ زبان (Large Language Models) ارائه کرده است: اندازه و هزینه بالای استقرار عملیاتی. این شرکت که مرکز آن در ناحیه باسک اسپانیا قرار دارد، با فناوری فشردهسازی جدیدی به نام CompactifAI تلاش میکند شکاف بین عملکرد مدلهای مرزدانش و توان مالی شرکتها برای بهکارگیری آنها را کاهش دهد.
CompactifAI چیست و چه مزیتی دارد؟
CompactifAI فناوری فشردهسازی مبتنی بر ایدههایی الهامگرفته از محاسبات کوانتومی معرفی شده توسط Multiverse است که هدف آن کاهش حجم مدلها بدون از دست رفتن قابلتوجه در دقت و کارایی است. نتیجه این فرایند مدلهایی با مصرف حافظه و تأخیر کمتر است که برای استقرار در محیطهای سازمانی و کاربردهای حساس به هزینهِ استنتاج مناسبترند.
HyperNova 60B 2602: مدل فشرده و در دسترس توسعهدهندگان
نسخه جدید مدل فشردهشده این شرکت با نام HyperNova 60B 2602 اکنون بهصورت رایگان در پلتفرم Hugging Face در دسترس توسعهدهندگان قرار دارد. این مدل با حجم حدود 32 گیگابایت تقریباً نصف حجم مدل پایهای خود یعنی gpt-oss-120b ارزیابیشده و طبق ادعای Multiverse، با کاهش مصرف حافظه و تأخیر، تقریباً به همان میزان دقت و توان محاسباتی را ارائه میدهد. بهبودهای نسخه 2602 بهویژه در پشتیبانی از فراخوانی ابزار (tool calling) و کدنویسی عاملمحور (agentic coding) محسوس است؛ دو حوزهای که هزینههای استنتاج میتوانند بالا باشند و نیازمند پاسخهای سریع و کارآمد هستند.
کاربردها و مزایای عملی فشردهسازی مدلها
– کاهش هزینههای استقرار و نگهداری مدلها برای شرکتها و مؤسسات.
– امکان استقرار در زیرساختهای با حافظه محدود یا نزدیک به لبه (edge)؛ که بهویژه در برنامههای زمانحقیقی مهم است.
– کاهش تأخیر در پاسخدهی و بهبود تجربه کاربری در سامانههای مبتنی بر عاملها و فراخوانی ابزار.
رقابت اروپایی و چشمانداز تجاری
Multiverse رقیبانی از جمله Mistral AI را در برابر خود میبیند؛ البته همزمان با رقابت تکنولوژیک، این شرکتها اشتراکاتی هم دارند، از جمله گسترش فعالیت فراملی (دفاتر در ایالات متحده، کانادا و اروپا) و جذب مشتریان سازمانی. Multiverse مشتریانی همچون Iberdrola، Bosch و بانک کانادا را اعلام کرده است.
در حوزه مالی نیز شایعاتی درباره تلاش این استارتاپ برای جذب سرمایه تازه به مبلغ حدود 500 میلیون یورو و ارزشیابی بیش از 1.5 میلیارد یورو مطرح شده است؛ شرکت تأیید کرده که گفتگوهای فعالی با سرمایهگذاران در جریان است اما در مورد رقم نهایی یا ارزشگذاری رسمی اظهارنظر نکرده است. گزارشهایی نیز از رسیدن درآمد سالانه تکرارپذیر (ARR) این شرکت به حدود 100 میلیون یورو در ژانویه حکایت دارند که اگر تأیید شود، نشاندهنده رشد سریع در مقیاسهای اروپایی خواهد بود (در مقایسه با ARR عظیم OpenAI یا رشد قابلتوجه Mistral).
ابعاد ژئوپلیتیک و حاکمیت دادهها
Multiverse خود را بهعنوان تأمینکننده «راهحلهای حاکمیتی در لایههای مختلفِ پشته هوش مصنوعی» معرفی میکند؛ موضعی که در بازارهای اروپایی و دولتها اهمیت دارد و به همکاریهایی از قبیل پروژهای با دولت منطقهای آراگون (Aragón) و حمایتهایی از سوی آژانس تبدیل فناوری اسپانیا (SETT) منجر شده است. حمایتهای منطقهای از ناحیه باسک نیز به این شرکت کمک کرده و این منطقه ممکن است بهزودی اولین یونیکورن خود را بهدست آورد.
چشمانداز نهایی
فشردهسازی مدلها مانند کاری که Multiverse با CompactifAI و HyperNova انجام داده، میتواند گسترش استفاده از مدلهای بزرگ زبان را در شرکتها و سازمانهایی که توان مالی یا زیرساختی محدودی دارند تسهیل کند. دسترسی رایگان توسعهدهندگان به نمونههای فشردهشده و برنامههای متنباز آتی (اعلامشده برای 2026) میتواند به شکلگیری اکوسیستمی کمک کند که گزینههای بیشتر و متنوعتری را برای استقرار هوش مصنوعی در اروپا و فراتر از آن فراهم آورد.
