Multiverse Computing دو مدل بسیار کوچک هوش مصنوعی برای اجرا روی دستگاههای کممنبع معرفی کرد
شرکت اروپایی Multiverse Computing از عرضه دو مدل فشرده هوش مصنوعی خبر داد که آنها را با الهام از اندازه مغز حیوانات «SuperFly» (مغز مگس) و «ChickBrain» (مغز جوجه) نامگذاری کرده است. این مدلها بهگونهای فشرده شدهاند که بتوانند بهصورت محلی روی دستگاههای اینترنت اشیاء (IoT)، گوشیهای هوشمند، تبلتها و رایانههای شخصی اجرا شوند و نیاز به اتصال دائم به اینترنت را کاهش دهند. هدف اصلی این محصولات، آوردن قابلیتهای گفتار، چت و در یک مورد حتی استدلال منطقی به دستگاههای با منابع محدود است.
فشردهسازی مبتنی بر ایدههای کوانتومی: CompactifAI
Multiverse میگوید فناوری فشردهسازی آنها تحت عنوان CompactifAI مبتنی بر الگوریتمهایی الهامگرفته از فیزیک کوانتومی است و برخلاف روشهای معمول در علوم کامپیوتر، کاهش اندازه مدلها را بدون افت محسوس کارایی امکانپذیر میکند. بنیانگذار شرکت، Román Orús، میگوید این الگوریتم «بیشتر ظریف و دقیق» عمل میکند و تاکنون نسخههای فشردهشده متعددی از مدلهای متنباز محبوب (از جمله Llama 4 Scout و Mistral Small 3.1) منتشر شده است.
مشخصات فنی و مزایا
– SuperFly: نسخه فشرده SmolLM2-135 از Hugging Face است که از 135 میلیون پارامتر به حدود 94 میلیون پارامتر کاهش یافته است. این مدل برای کاربردهای محلی و محدود مانند رابطهای صوتی ساده در دستگاههای خانگی طراحی شده و میتواند با سختافزار بسیار سبک (مثلاً بردهای مشابه Arduino) تعامل صوتی را فراهم کند. SuperFly برای پردازشهای تخصصی یا استدلال پیچیده هدفگذاری نشده است، بلکه تمرکز آن بر پاسخدهی محلی، حفظ حریم خصوصی و تاخیر بسیار کم است.
- ChickBrain: نسخه فشردهشدهای از Llama 3.1 8B متا با اندازه نهایی حدود 3.2 میلیارد پارامتر است. این مدل با وجود فشردهسازی، قابلیتهای استدلال و نگاشت دانش قویتری دارد و طبق آزمایشهای داخلی Multiverse در برخی بنچمارکهای استاندارد (از جمله MMLU-Pro، Math 500، GSM8K و GPQA Diamond) حتی در برخی موارد عملکردی اندکی بهتر از مدل اصلی نشان داده است. ChickBrain بهقدری کوچک شده که امکان اجرای محلی روی لپتاپها (مانند MacBook) را بدون نیاز به اتصال اینترنت فراهم میکند.
کاربردها و پیامدها برای بازار دستگاهها
این مدلهای بسیار کوچک میتوانند قابلیتهای چت، فرمان صوتی، عیبیابی و پاسخ به سوالات عمومی را به طیف وسیعی از دستگاههای هوشمند وارد کنند: از لوازم خانگی هوشمند و ساعتهای هوشمند گرفته تا تلفنها و کامپیوترهای شخصی. اجرای محلی مدلها مزایایی مانند کاهش تاخیر، بهبود حفظ حریم خصوصی کاربران و کاهش هزینههای پردازشی ابری به همراه دارد. Multiverse اعلام کرده که در مذاکرات با تولیدکنندگان مطرح سختافزار از جمله اپل، سامسونگ، سونی و HP برای ادغام این مدلها در محصولاتشان است.
چشمانداز تجاری و دسترسی توسعهدهندگان
Multiverse که دفتر مرکزیاش در دونوستیا، اسپانیا قرار دارد و از زمان تأسیس در 2019 تاکنون حدود 250 میلیون دلار سرمایه جذب کرده، در دور اخیر خود 189 میلیون یورو (حدود 215 میلیون دلار) جذب سرمایه داشته است. این شرکت علاوه بر فروش مستقیم مدلها به تولیدکنندگان، سرویس API میزبانیشده روی AWS را نیز ارائه میدهد تا توسعهدهندگان بتوانند از نسخههای فشرده مدلها در اپلیکیشنهای خود استفاده کنند.
محدودیتها و جایگاه در اکوسیستم مدلها
Multiverse تصریح میکند که هدفش رقابت با بزرگترین مدلهای حالتهنوز (state-of-the-art) در رتبهبندیها نیست؛ نکته کلیدی این است که بتوان مدلها را تا حد زیادی کوچک کرد بدون آنکه افت قابلتوجهی در عملکرد به وجود آید. این رویکرد میتواند امکان کاربردهای جدید و توزیعشده هوش مصنوعی روی دستگاههای کممنبع را گسترش دهد.
جمعبندی
معرفی SuperFly و ChickBrain نشاندهنده روند رو به رشد «هوش مصنوعی روی دستگاه» است؛ رویکردی که با فشردهسازی هوشمندانه مدلها، تجربه کاربری بهتر، حفظ حریم خصوصی و کاهش نیاز به پردازش ابری را برای دستگاههای روزمره فراهم میآورد. اگر ادعاهای عملکردی این شرکت در دنیای واقعی تایید شود، انتظار میرود تولیدکنندگان سختافزار و سازندگان دستگاههای هوشمند به سرعت برای ادغام این مدلهای کوچک و کمهزینه در محصولاتشان اقدام کنند.
