گوگل در رویداد Android Show: I/O Edition از مجموعهای از قابلیتهای جدید هوش مصنوعی تحت برند Gemini Intelligence رونمایی کرد که هدف آن سادهسازی وظایف پیچیده در دستگاههای اندرویدی و ارائه تجربهای یکپارچهتر از تعامل با اپلیکیشنها و وب است. این قابلیتها شامل انجام عملیات بینبرنامهای (cross-app)، مرور خودکار وب، تکمیل فرمها، تبدیل گفتار به نوشتار هوشمند و ایجاد ویجتهای سفارشی با توصیف زبان طبیعی میشود.
قابلیتهای چندمرحلهای و انجام وظایف بین اپها
یکی از مهمترین ویژگیها، توانایی Gemini برای مدیریت فرایندهای چندمرحلهای است؛ برای مثال، کپی کردن فهرست خرید از اپ یادداشت و افزودن موارد به سبد خرید در اپ فروشگاهی بهصورت خودکار. برای فعالسازی، کاربر با فشار دادن دکمه پاور گوشی و بیان دستور، کار را آغاز میکند و محتوای نمایشدادهشده روی صفحه بهعنوان زمینه (context) برای دستیار عمل میکند. گوگل تأکید کرده که Gemini قبل از نهاییسازی خرید، برای تأیید نهایی از کاربر تأییدیه میگیرد.
مرور خودکار وب و خلاصهسازی محتوا در کروم
قابلیت Auto-browse که پیشتر بهصورت آزمایشی معرفی شده بود و میتوانست وظایفی مثل رزرو وقت را انجام دهد، اکنون به اندروید نیز میآید. علاوه بر این، نسخه اندرویدی Gemini در مرورگر Chrome میتواند محتوای صفحات وب را خلاصه کند و به پرسشهای کاربران درباره متن صفحه پاسخ دهد—مشابه تجربهای که کاربران دسکتاپ با Gemini در کروم دارند.
تکمیل خودکار فرمها با Personal Intelligence (اختیاری)
Gemini میتواند پس از یادگیری جزئیات پروفایل کاربر از طریق قابلیت Personal Intelligence، فرمها را به نمایندگی از کاربر پر کند. گوگل اعلام کرده این ویژگی بهصورت اختیاری است و کاربر میتواند هر زمان از طریق تنظیمات آن را غیرفعال کند؛ این موضوع نقطهای مهم در رابطه با حریم خصوصی و کنترل دادههاست که شرکت بارها بر انتخابی بودن آن تأکید کرده است.
Gboard و قابلیت Rambler برای دیکته هوشمند
کیبورد Gboard نیز مجهز به Gemini میشود و از قابلیتهای چندرسانهای مدل بهره خواهد برد. ویژگی جدیدی بهنام Rambler امکان دیکته بههمراه حفظ لحن گفتار کاربر، حذف کلمات اضافی و فرمتبندی متن را فراهم میکند؛ این ابزار برای تولید متنهای طبیعی و سریع در پیامها و ایمیلها مفید است.
ویجتسازی با زبان طبیعی (Vibe-code)
گوگل امکان جدیدی برای ساخت ویجتها با توصیفهای طبیعی ارائه داده است؛ مثلاً با نوشتن یا گفتن جملهای مانند «هر هفته سه دستور غذایی سرشار از پروتئین پیشنهاد بده»، میتوان ویجت برنامهریزی وعدههای غذایی ایجاد کرد. این رویکرد سرعت طراحی تجربههای شخصیشده را افزایش میدهد و به توسعهدهندگان و کاربران امکان میدهد بدون دانش کدنویسی اولیه، تعاملات سفارشی بسازند.
سازگاری طراحی و برنامه زمانی عرضه
گوگل اعلام کرده Gemini Intelligence از زبان طراحی Material 3 برای ارائه قابلیتها پیروی میکند تا تجربهای یکپارچه و هماهنگ با رابط کاربری اندروید فراهم شود. اولین دستگاههایی که این قابلیتها را دریافت میکنند، گوشیهای جدید سامسونگ گلکسی و پیکسل گوگل خواهد بود و در ادامه سال به سایر دستگاههای اندرویدی گسترش خواهد یافت.
پیامدها و کاربردها
این مجموعه از قابلیتها میتواند تجربه کاربری اندروید را متحول کند: صرفهجویی در زمان با انجام وظایف چندمرحلهای، بهبود دسترسی از طریق دیکته هوشمند، و تسهیل ایجاد ویجتهای کاربردی بدون نیاز به توسعهگر. در عین حال نکات مربوط به حریم خصوصی و کنترل دادهها—از جمله حالتهای اختیاری و امکان خاموشکردن ویژگیها—نقش مهمی در پذیرش عمومی خواهند داشت.
نتیجهگیری
اضافهشدن Gemini Intelligence به اکوسیستم اندروید گامی مهم در جهت هوشمندسازی تعاملات موبایلی است؛ این امکانات ترکیبی از توان مدلهای زبانی پیشرفته و همافزایی با اپلیکیشنهای محلی را برای سادهسازی کارهای روزمره ارائه میدهد و در تابستان امسال نخستین موج آن برای کاربران گلکسی و پیکسل در دسترس قرار میگیرد.
