تحقیقات ارائه شده از سوی محققان مایکروسافت نشاندهنده توسعه بزرگترین مدل هوش مصنوعی ۱ بیتی به نام “BitNet b1.58 2B4T” است. این مدل بهطور عمومی تحت مجوز MIT در دسترس قرار گرفته و قابلیت اجرا بر روی پردازندههای مرکزی (CPU)، از جمله پردازندههای M2 اپل را دارد. BitNet ها به عنوان مدلهای فشرده طراحی شدهاند تا بر روی سختافزارهای کممصرف کار کنند.
در مدلهای استاندارد، وزنها، که معیاری برای تعریف ساختار داخلی مدل هستند، معمولاً بهروشی کوانتیزه میشوند تا عملکرد بهتری بر روی دستگاههای مختلف ارائه دهند. کوانتیزه کردن وزنها به کاهش تعداد بیتها – کوچکترین واحدهای قابل پردازش توسط کامپیوتر – کمک میکند و به مدلها این امکان را میدهد که روی تراشههایی با حافظه کمتر و سریعتر اجرا شوند. BitNet ها وزنها را به سه مقدار -۱، ۰ و ۱ کوانتیزه میکنند، که بهنظر میرسد آنها را از نظر حافظه و کارایی محاسباتی به مراتب کارآمدتر از سایر مدلها میسازد.
پژوهشگران مایکروسافت ادعا میکنند که BitNet b1.58 2B4T نخستین BitNet با ۲ میلیارد پارامتر است. این مدل بر روی مجموعه دادهای از ۴ تریلیون توکن آموزش دیده که معادل حدود ۳۳ میلیون کتاب میباشد. طبق ادعای محققان، BitNet b1.58 2B4T در مقایسه با مدلهای سنتی با اندازه مشابه عملکرد بهتری دارد. با این حال، این مدل بهطور بسیار قاطعانهای از مدلهای رقیب ۲ میلیارد پارامتری پیشی نمیگیرد، اما توانسته است عملکرد قابل توجهی از خود نشان دهد.
آزمایشهای انجامشده بر روی این مدل نشان میدهد که BitNet b1.58 2B4T در مقایسه با مدلهایی مانند Llama 3.2 1B از متا، Gemma 3 1B از گوگل و Qwen 2.5 1.5B از علیبابا، در معیارهایی همچون GSM8K (مجموعهای از مسائل ریاضی سطح ابتدایی) و PIQA (آزمایش مهارتهای تفکر منطقی در مورد موضوعات فیزیکی) عملکرد بهتری دارد. جالبتر این که BitNet b1.58 2B4T نسبت به مدلهای مشابه خود سرعت بیشتری دارد و در برخی موارد، دو برابر سریعتر عمل میکند در حالی که از مقدار کمتری حافظه استفاده میکند.
با این حال، برای دستیابی به این عملکرد، نیاز به استفاده از قابلیتی سفارشی از مایکروسافت تحت عنوان bitnet.cpp وجود دارد که در حال حاضر تنها با برخی سختافزارها سازگار است. این موضوع بهویژه با توجه به عدم پشتیبانی از واحدهای پردازش گرافیکی (GPU) که عمدتاً زیرساخت هوش مصنوعی را تشکیل میدهند، از اهمیت بالایی برخوردار است. لذا، اگرچه BitNet ها ممکن است نویدبخش باشند، بهویژه برای دستگاههای با منابع محدود، عدم سازگاری همچنان یک چالش بزرگ خواهد بود.