تحقیقات ارائه شده از سوی محققان مایکروسافت نشان‌دهنده توسعه بزرگ‌ترین مدل هوش مصنوعی ۱ بیتی به نام “BitNet b1.58 2B4T” است. این مدل به‌طور عمومی تحت مجوز MIT در دسترس قرار گرفته و قابلیت اجرا بر روی پردازنده‌های مرکزی (CPU)، از جمله پردازنده‌های M2 اپل را دارد. BitNet ها به عنوان مدل‌های فشرده طراحی شده‌اند تا بر روی سخت‌افزارهای کم‌مصرف کار کنند.

در مدل‌های استاندارد، وزن‌ها، که معیاری برای تعریف ساختار داخلی مدل هستند، معمولاً به‌روشی کوانتیزه می‌شوند تا عملکرد بهتری بر روی دستگاه‌های مختلف ارائه دهند. کوانتیزه کردن وزن‌ها به کاهش تعداد بیت‌ها – کوچک‌ترین واحدهای قابل پردازش توسط کامپیوتر – کمک می‌کند و به مدل‌ها این امکان را می‌دهد که روی تراشه‌هایی با حافظه کمتر و سریع‌تر اجرا شوند. BitNet ها وزن‌ها را به سه مقدار -۱، ۰ و ۱ کوانتیزه می‌کنند، که به‌نظر می‌رسد آن‌ها را از نظر حافظه و کارایی محاسباتی به مراتب کارآمدتر از سایر مدل‌ها می‌سازد.

پژوهشگران مایکروسافت ادعا می‌کنند که BitNet b1.58 2B4T نخستین BitNet با ۲ میلیارد پارامتر است. این مدل بر روی مجموعه داده‌ای از ۴ تریلیون توکن آموزش دیده که معادل حدود ۳۳ میلیون کتاب می‌باشد. طبق ادعای محققان، BitNet b1.58 2B4T در مقایسه با مدل‌های سنتی با اندازه مشابه عملکرد بهتری دارد. با این حال، این مدل به‌طور بسیار قاطعانه‌ای از مدل‌های رقیب ۲ میلیارد پارامتری پیشی نمی‌گیرد، اما توانسته است عملکرد قابل توجهی از خود نشان دهد.

آزمایش‌های انجام‌شده بر روی این مدل نشان می‌دهد که BitNet b1.58 2B4T در مقایسه با مدل‌هایی مانند Llama 3.2 1B از متا، Gemma 3 1B از گوگل و Qwen 2.5 1.5B از علی‌بابا، در معیارهایی همچون GSM8K (مجموعه‌ای از مسائل ریاضی سطح ابتدایی) و PIQA (آزمایش مهارت‌های تفکر منطقی در مورد موضوعات فیزیکی) عملکرد بهتری دارد. جالب‌تر این که BitNet b1.58 2B4T نسبت به مدل‌های مشابه خود سرعت بیشتری دارد و در برخی موارد، دو برابر سریع‌تر عمل می‌کند در حالی که از مقدار کمتری حافظه استفاده می‌کند.

با این حال، برای دستیابی به این عملکرد، نیاز به استفاده از قابلیتی سفارشی از مایکروسافت تحت عنوان bitnet.cpp وجود دارد که در حال حاضر تنها با برخی سخت‌افزارها سازگار است. این موضوع به‌ویژه با توجه به عدم پشتیبانی از واحدهای پردازش گرافیکی (GPU) که عمدتاً زیرساخت هوش مصنوعی را تشکیل می‌دهند، از اهمیت بالایی برخوردار است. لذا، اگرچه BitNet ها ممکن است نویدبخش باشند، به‌ویژه برای دستگاه‌های با منابع محدود، عدم سازگاری همچنان یک چالش بزرگ خواهد بود.

تبدیل متن به صوت با هوش مصنوعی

دیدگاه‌ خود را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

اسکرول به بالا