معرفی Gemma 3 270M گوگل: مدل منبع باز کم‌حجم و قابل اجرا روی گوشی‌های هوشمند

گوگل دیپ‌مایند از مدل متن‌باز جدید Gemma 3 270M رونمایی کرد؛ مدل کوچک اما توانمند برای اجرای آفلاین روی دستگاه‌ها

گوگل دیپ‌مایند امروز نسخه‌ای جدید از خانواده Gemma را منتشر کرد: Gemma 3 270M، یک مدل زبانی سبک با 270 میلیون پارامتر که برای اجرای سریع و مصرف انرژی پایین روی دستگاه‌های محلی (on-device) طراحی شده است. هدف اصلی این مدل ارائه بازدهی بالا در سخت‌افزارهای محدود مانند گوشی‌های هوشمند، مرورگرها و Raspberry Pi است، به‌طوری که کاربردهای حوزه‌های حریم خصوصی، تأخیر کم و کاربری آفلاین را پوشش دهد.

معماری و مشخصات فنی
– اندازه مدل: 270 میلیون پارامتر (شامل 170 میلیون پارامتر embedding و 100 میلیون پارامتر در بلاک‌های ترنسفورمر).
– واژگان گسترده: دیکشنری 256k توکن که قابلیت پردازش توکن‌های نادر و دامنه‌دار را بهبود می‌دهد.
– سازگاری: معماری پایه با مدل‌های بزرگ‌تر Gemma 3 مشترک است که امکان جابجایی و یکپارچگی میان نسخه‌ها را فراهم می‌کند.
– نسخه‌ها: مدل پیش‌آموزش‌دیده و نسخه instruction-tuned به‌صورت جداگانه عرضه شده و checkpoints آموزش دیده برای Quantization-Aware Training (QAT) نیز در دسترس است.

عملکرد و نتیجه‌گیری معیارها
در آزمایش IFEval (معیار پیروی از دستورات)، نسخه instruction-tuned مدل نمره 51.2% کسب کرده است؛ رقمی که آن را بالاتر از مدل‌های کوچک مشابه مانند SmolLM2 135M و Qwen 2.5 0.5B Instruct قرار می‌دهد و تا حدی به محدوده عملکرد برخی مدل‌های میلیارد پارامتری نزدیک می‌شود. البته برخی رقبا مانند LFM2-350M از شرکت Liquid AI با اندازه مشابه، عملکرد بالاتری (65.12%) گزارش کرده‌اند که در گزارش‌های مقایسه‌ای منتشرشده توسط Google منظور نشده بود.

قابلیت‌های اجرای محلی و مصرف انرژی
یکی از برجسته‌ترین ویژگی‌های Gemma 3 270M قابلیت اجرا روی سخت‌افزارهای بسیار سبک است؛ تیم دیپ‌مایند نشان داده که این مدل می‌تواند در مرورگر وب، Raspberry Pi و حتی دستگاه‌های مصرفی با منابع محدود اجرا شود. در آزمایش‌های داخلی با نسخه INT4-quantized روی پردازنده Pixel 9 Pro SoC، انجام 25 گفتگو تنها 0.75% از باتری دستگاه را مصرف کرده که نشان‌دهنده صرفه‌جویی قابل‌توجه انرژی و مناسب‌بودن برای کاربردهای موبایل و آفلاین است.

بهره‌برداری، آموزش سریع و استقرار
Gemma 3 270M طوری طراحی شده که به‌سرعت قابل fine-tuning باشد؛ توسعه‌دهندگان می‌توانند در چند دقیقه مدل را برای وظایف دامنه‌محور خود بهینه کنند. مستندات، ریسپی‌های fine-tuning و راهنمای استقرار برای ابزارهایی مانند Hugging Face، UnSloth و JAX فراهم شده تا مسیر از پژوهش تا تولید کوتاه و ساده شود. QAT checkpoints اجازه می‌دهد نسخه‌های INT4 با حداقل افت عملکرد تولید و در محیط‌های محدود منابع به‌کار گرفته شوند.

کاربردهای پیشنهادی
– پردازش متن ساختاریافته، استخراج موجودیت‌ها و تحلیل احساسات در دستگاه‌های موبایل
– مسیر‌یابی پرسش‌ها، تطبیق کوئری‌ها و چک‌های تطبیقی (compliance checks) برای سامانه‌های تجاری
– تولید متن خلاقانه و اپلیکیشن‌های تعاملی آفلاین (نمونه عملی: ژنراتور داستان شبانه که بدون اتصال به سرور در مرورگر اجرا می‌شود)
– پیاده‌سازی شبکه‌ای از مدل‌های تخصصی کوچک که برای هر وظیفه خاص بهینه شده‌اند و نسبت به مدل‌های بزرگ عمومی هزینه و تأخیر کمتری دارند

مجوز و محدودیت‌های استفاده
Gemma 3 270M تحت Gemma Terms of Use عرضه می‌شود؛ یعنی استفاده، تغییر و توزیع مدل و مشتقات آن امکان‌پذیر است اما با شرایطی مانند حفظ محدودیت‌های مندرج در Prohibited Use Policy، اطلاع‌رسانی به دریافت‌کنندگان بعدی و ثبت تغییرات لازم همراه است. این مجوز به شکلی گسترده اجازه استفاده تجاری را می‌دهد اما لایسنس به‌معنای متن‌باز کلاسیک نیست. همچنین خروجی‌های تولیدی از سوی گوگل ادعا نشده و کسب‌وکارها می‌توانند بر محتوای تولیدی مالکیت داشته باشند، به شرط رعایت قوانین و محدودیت‌ها (تضمین عدم ایجاد محتوای مضر، رعایت حریم خصوصی و قوانین محلی).

چرا Gemma 3 270M مهم است؟
این مدل نشان‌دهنده جهت‌گیری جدیدی در اکوسیستم هوش مصنوعی است که به‌جای اتکا صرف به افزایش اندازه مدل، به بهینه‌سازی برای موارد کاربردی خاص، سرعت استقرار، هزینه کمتر و عملکرد آفلاین توجه دارد. برای شرکت‌ها و توسعه‌دهندگانی که به دنبال پیاده‌سازی راهکارهای خصوصی، کم‌هزینه و کم‌تاخیر روی دستگاه‌های کاربر هستند، Gemma 3 270M می‌تواند گزینه‌ای کاربردی و سریع باشد.

نتیجه‌گیری
Gemma 3 270M نمونه‌ای از پیشرفت در طراحی مدل‌های کوچک‌تر و بهینه‌شده است که امکان اجرای محلی و خصوصی‌سازی سریع را فراهم می‌آورد. با وجود رقابت‌های قوی در این رده، ترکیب مصرف انرژی پایین، قابلیت اجرا در سخت‌افزار محدود و مجموعه ابزارهای پشتیبانی می‌تواند این مدل را برای طیف وسیعی از کاربردهای تجاری و مصرفی جذاب کند.

تبدیل متن‌های فارسی به صوت طبیعی و روان

معرفی Gemma 3 270M گوگل: مدل منبع باز کم‌حجم و قابل اجرا روی گوشی‌های هوشمند

دیدگاه‌ خود را بنویسید لغو پاسخ