گوگل دیپمایند از مدل متنباز جدید Gemma 3 270M رونمایی کرد؛ مدل کوچک اما توانمند برای اجرای آفلاین روی دستگاهها
گوگل دیپمایند امروز نسخهای جدید از خانواده Gemma را منتشر کرد: Gemma 3 270M، یک مدل زبانی سبک با 270 میلیون پارامتر که برای اجرای سریع و مصرف انرژی پایین روی دستگاههای محلی (on-device) طراحی شده است. هدف اصلی این مدل ارائه بازدهی بالا در سختافزارهای محدود مانند گوشیهای هوشمند، مرورگرها و Raspberry Pi است، بهطوری که کاربردهای حوزههای حریم خصوصی، تأخیر کم و کاربری آفلاین را پوشش دهد.
معماری و مشخصات فنی
– اندازه مدل: 270 میلیون پارامتر (شامل 170 میلیون پارامتر embedding و 100 میلیون پارامتر در بلاکهای ترنسفورمر).
– واژگان گسترده: دیکشنری 256k توکن که قابلیت پردازش توکنهای نادر و دامنهدار را بهبود میدهد.
– سازگاری: معماری پایه با مدلهای بزرگتر Gemma 3 مشترک است که امکان جابجایی و یکپارچگی میان نسخهها را فراهم میکند.
– نسخهها: مدل پیشآموزشدیده و نسخه instruction-tuned بهصورت جداگانه عرضه شده و checkpoints آموزش دیده برای Quantization-Aware Training (QAT) نیز در دسترس است.
عملکرد و نتیجهگیری معیارها
در آزمایش IFEval (معیار پیروی از دستورات)، نسخه instruction-tuned مدل نمره 51.2% کسب کرده است؛ رقمی که آن را بالاتر از مدلهای کوچک مشابه مانند SmolLM2 135M و Qwen 2.5 0.5B Instruct قرار میدهد و تا حدی به محدوده عملکرد برخی مدلهای میلیارد پارامتری نزدیک میشود. البته برخی رقبا مانند LFM2-350M از شرکت Liquid AI با اندازه مشابه، عملکرد بالاتری (65.12%) گزارش کردهاند که در گزارشهای مقایسهای منتشرشده توسط Google منظور نشده بود.
قابلیتهای اجرای محلی و مصرف انرژی
یکی از برجستهترین ویژگیهای Gemma 3 270M قابلیت اجرا روی سختافزارهای بسیار سبک است؛ تیم دیپمایند نشان داده که این مدل میتواند در مرورگر وب، Raspberry Pi و حتی دستگاههای مصرفی با منابع محدود اجرا شود. در آزمایشهای داخلی با نسخه INT4-quantized روی پردازنده Pixel 9 Pro SoC، انجام 25 گفتگو تنها 0.75% از باتری دستگاه را مصرف کرده که نشاندهنده صرفهجویی قابلتوجه انرژی و مناسببودن برای کاربردهای موبایل و آفلاین است.
بهرهبرداری، آموزش سریع و استقرار
Gemma 3 270M طوری طراحی شده که بهسرعت قابل fine-tuning باشد؛ توسعهدهندگان میتوانند در چند دقیقه مدل را برای وظایف دامنهمحور خود بهینه کنند. مستندات، ریسپیهای fine-tuning و راهنمای استقرار برای ابزارهایی مانند Hugging Face، UnSloth و JAX فراهم شده تا مسیر از پژوهش تا تولید کوتاه و ساده شود. QAT checkpoints اجازه میدهد نسخههای INT4 با حداقل افت عملکرد تولید و در محیطهای محدود منابع بهکار گرفته شوند.
کاربردهای پیشنهادی
– پردازش متن ساختاریافته، استخراج موجودیتها و تحلیل احساسات در دستگاههای موبایل
– مسیریابی پرسشها، تطبیق کوئریها و چکهای تطبیقی (compliance checks) برای سامانههای تجاری
– تولید متن خلاقانه و اپلیکیشنهای تعاملی آفلاین (نمونه عملی: ژنراتور داستان شبانه که بدون اتصال به سرور در مرورگر اجرا میشود)
– پیادهسازی شبکهای از مدلهای تخصصی کوچک که برای هر وظیفه خاص بهینه شدهاند و نسبت به مدلهای بزرگ عمومی هزینه و تأخیر کمتری دارند
مجوز و محدودیتهای استفاده
Gemma 3 270M تحت Gemma Terms of Use عرضه میشود؛ یعنی استفاده، تغییر و توزیع مدل و مشتقات آن امکانپذیر است اما با شرایطی مانند حفظ محدودیتهای مندرج در Prohibited Use Policy، اطلاعرسانی به دریافتکنندگان بعدی و ثبت تغییرات لازم همراه است. این مجوز به شکلی گسترده اجازه استفاده تجاری را میدهد اما لایسنس بهمعنای متنباز کلاسیک نیست. همچنین خروجیهای تولیدی از سوی گوگل ادعا نشده و کسبوکارها میتوانند بر محتوای تولیدی مالکیت داشته باشند، به شرط رعایت قوانین و محدودیتها (تضمین عدم ایجاد محتوای مضر، رعایت حریم خصوصی و قوانین محلی).
چرا Gemma 3 270M مهم است؟
این مدل نشاندهنده جهتگیری جدیدی در اکوسیستم هوش مصنوعی است که بهجای اتکا صرف به افزایش اندازه مدل، به بهینهسازی برای موارد کاربردی خاص، سرعت استقرار، هزینه کمتر و عملکرد آفلاین توجه دارد. برای شرکتها و توسعهدهندگانی که به دنبال پیادهسازی راهکارهای خصوصی، کمهزینه و کمتاخیر روی دستگاههای کاربر هستند، Gemma 3 270M میتواند گزینهای کاربردی و سریع باشد.
نتیجهگیری
Gemma 3 270M نمونهای از پیشرفت در طراحی مدلهای کوچکتر و بهینهشده است که امکان اجرای محلی و خصوصیسازی سریع را فراهم میآورد. با وجود رقابتهای قوی در این رده، ترکیب مصرف انرژی پایین، قابلیت اجرا در سختافزار محدود و مجموعه ابزارهای پشتیبانی میتواند این مدل را برای طیف وسیعی از کاربردهای تجاری و مصرفی جذاب کند.
