گوگل هوش مصنوعی عامل‌محور و ویجت‌های Vibe را به اندروید می‌آورد

گوگل در رویداد Android Show: I/O Edition از مجموعه‌ای از قابلیت‌های جدید هوش مصنوعی تحت برند Gemini Intelligence رونمایی کرد که هدف آن ساده‌سازی وظایف پیچیده در دستگاه‌های اندرویدی و ارائه تجربه‌ای یکپارچه‌تر از تعامل با اپلیکیشن‌ها و وب است. این قابلیت‌ها شامل انجام عملیات بین‌برنامه‌ای (cross-app)، مرور خودکار وب، تکمیل فرم‌ها، تبدیل گفتار به نوشتار هوشمند و ایجاد ویجت‌های سفارشی با توصیف زبان طبیعی می‌شود.

قابلیت‌های چندمرحله‌ای و انجام وظایف بین اپ‌ها
یکی از مهم‌ترین ویژگی‌ها، توانایی Gemini برای مدیریت فرایندهای چندمرحله‌ای است؛ برای مثال، کپی کردن فهرست خرید از اپ یادداشت و افزودن موارد به سبد خرید در اپ فروشگاهی به‌صورت خودکار. برای فعال‌سازی، کاربر با فشار دادن دکمه پاور گوشی و بیان دستور، کار را آغاز می‌کند و محتوای نمایش‌داده‌شده روی صفحه به‌عنوان زمینه (context) برای دستیار عمل می‌کند. گوگل تأکید کرده که Gemini قبل از نهایی‌سازی خرید، برای تأیید نهایی از کاربر تأییدیه می‌گیرد.

مرور خودکار وب و خلاصه‌سازی محتوا در کروم
قابلیت Auto-browse که پیش‌تر به‌صورت آزمایشی معرفی شده بود و می‌توانست وظایفی مثل رزرو وقت را انجام دهد، اکنون به اندروید نیز می‌آید. علاوه بر این، نسخه اندرویدی Gemini در مرورگر Chrome می‌تواند محتوای صفحات وب را خلاصه کند و به پرسش‌های کاربران درباره متن صفحه پاسخ دهد—مشابه تجربه‌ای که کاربران دسکتاپ با Gemini در کروم دارند.

تکمیل خودکار فرم‌ها با Personal Intelligence (اختیاری)
Gemini می‌تواند پس از یادگیری جزئیات پروفایل کاربر از طریق قابلیت Personal Intelligence، فرم‌ها را به نمایندگی از کاربر پر کند. گوگل اعلام کرده این ویژگی به‌صورت اختیاری است و کاربر می‌تواند هر زمان از طریق تنظیمات آن را غیرفعال کند؛ این موضوع نقطه‌ای مهم در رابطه با حریم خصوصی و کنترل داده‌هاست که شرکت بارها بر انتخابی بودن آن تأکید کرده است.

Gboard و قابلیت Rambler برای دیکته هوشمند
کیبورد Gboard نیز مجهز به Gemini می‌شود و از قابلیت‌های چندرسانه‌ای مدل بهره خواهد برد. ویژگی جدیدی به‌نام Rambler امکان دیکته به‌همراه حفظ لحن گفتار کاربر، حذف کلمات اضافی و فرمت‌بندی متن را فراهم می‌کند؛ این ابزار برای تولید متن‌های طبیعی و سریع در پیام‌ها و ایمیل‌ها مفید است.

ویجت‌سازی با زبان طبیعی (Vibe-code)
گوگل امکان جدیدی برای ساخت ویجت‌ها با توصیف‌های طبیعی ارائه داده است؛ مثلاً با نوشتن یا گفتن جمله‌ای مانند «هر هفته سه دستور غذایی سرشار از پروتئین پیشنهاد بده»، می‌توان ویجت برنامه‌ریزی وعده‌های غذایی ایجاد کرد. این رویکرد سرعت طراحی تجربه‌های شخصی‌شده را افزایش می‌دهد و به توسعه‌دهندگان و کاربران امکان می‌دهد بدون دانش کدنویسی اولیه، تعاملات سفارشی بسازند.

سازگاری طراحی و برنامه زمانی عرضه
گوگل اعلام کرده Gemini Intelligence از زبان طراحی Material 3 برای ارائه قابلیت‌ها پیروی می‌کند تا تجربه‌ای یکپارچه و هماهنگ با رابط کاربری اندروید فراهم شود. اولین دستگاه‌هایی که این قابلیت‌ها را دریافت می‌کنند، گوشی‌های جدید سامسونگ گلکسی و پیکسل گوگل خواهد بود و در ادامه سال به سایر دستگاه‌های اندرویدی گسترش خواهد یافت.

پیامدها و کاربردها
این مجموعه از قابلیت‌ها می‌تواند تجربه کاربری اندروید را متحول کند: صرفه‌جویی در زمان با انجام وظایف چندمرحله‌ای، بهبود دسترسی از طریق دیکته هوشمند، و تسهیل ایجاد ویجت‌های کاربردی بدون نیاز به توسعه‌گر. در عین حال نکات مربوط به حریم خصوصی و کنترل داده‌ها—از جمله حالت‌های اختیاری و امکان خاموش‌کردن ویژگی‌ها—نقش مهمی در پذیرش عمومی خواهند داشت.

نتیجه‌گیری
اضافه‌شدن Gemini Intelligence به اکوسیستم اندروید گامی مهم در جهت هوشمندسازی تعاملات موبایلی است؛ این امکانات ترکیبی از توان مدل‌های زبانی پیشرفته و هم‌افزایی با اپلیکیشن‌های محلی را برای ساده‌سازی کارهای روزمره ارائه می‌دهد و در تابستان امسال نخستین موج آن برای کاربران گلکسی و پیکسل در دسترس قرار می‌گیرد.

تولید تصویر با هوش مصنوعی

گوگل هوش مصنوعی عامل‌محور و ویجت‌های Vibe را به اندروید می‌آورد

دیدگاه‌ خود را بنویسید لغو پاسخ