عینکهای هوش مصنوعی گوگل با نمایشگر درونلنزی: تجربه اولیه و چشمانداز پیشرو
در جریان کنفرانس توسعهدهندگان Google I/O این هفته، فرصتی دست داد تا بهصورت کوتاه با نمونهی اولیه عینکهای هوش مصنوعی گوگل که تجربهای ترکیبی از صوت و تصویر ارائه میدهند کار کنیم. این گجت که سال گذشته معرفی شد، از نمایشگر درونلنزی (in-lens display) بهره میبرد و اطلاعات کاربردی را بهصورت لایهای روی دنیای واقعی نمایش میدهد؛ از نمایش وضعیت آبوهوا و مسیرهای پیادهروی تا ترجمهی زنده و ویجتهای سفارشی شده توسط هوش مصنوعی.
همکاری طراحی و وضعیت نمونهی اولیه
گوگل این عینکها را با همکاری برندهایی چون Warby Parker، Gentle Monster و سامسونگ توسعه داده تا فناوری خود را در قالب طراحیهای تجاری آنها عرضه کند. نمونهای که در I/O دیده شد هنوز پروتوتایپ است؛ به عبارت دیگر تمرکز روی آزمایش فناوری نمایشگر و تاثیر آن روی مصرف باتری بوده و جزئیات ظاهری و انواع فریمها در این نمونه نهایی نشدهاند. بنابراین نسخه تجاری احتمالا از لحاظ فیت و جزئیات ظاهری تفاوت قابل توجهی خواهد داشت.
ویژگیهای کلیدی
– نمایشگر درونلنزی و ویجتها: ویجتهایی مانند مسیرهای پیادهروی، اطلاعات اوبر، ترجمه زنده و اطلاعات روزانه قابل نمایش خواهند بود؛ حتی امکان ساخت ویجتهای سفارشی با کمک هوش مصنوعی پیشبینی شده است.
– سازگاری با اندروید و iOS: گوگل اعلام کرده عینکها هم با گوشیهای اندروید و هم با آیفون سازگار خواهند بود، چه در نسخه صوتی و چه در نسخهای که نمایشگر دارد.
– دستیار Gemini: با فشردن دو ثانیهای روی قسمت راست فریم، دستیار Gemini فعال شده و به فرمان صوتی گوش میدهد. در نمونهی نمایشی، فعالسازی Gemini همزمان دوربین را روشن میکرد؛ اما نسخه نهایی اجازه میدهد این رفتار را کاربر تنظیم کند.
– عکاسی و ویرایش مبتنی بر هوش مصنوعی: گرفتن عکس با دکمه یا فرمان صوتی ممکن است. کاربر میتواند از Gemini بخواهد عکس را ویرایش کند (مثلاً تبدیل چهره به سبک انیمه)؛ پردازش تصویر از طریق سرورهای Gemini و سرویسهای مرتبط انجام میشود و بسته به کیفیت شبکه میتواند تا حدود چند ده ثانیه طول بکشد.
– ترجمه و زیرنویس زنده: یکی از جذابترین دمویها ترجمهی همزمان بود؛ عینک زبان صحبتشده را تشخیص داده و متن ترجمهشده را نمایش داده و Gemini صدای ترجمه را پخش میکند. تجربهای که میتواند برای مسافران بینالمللی بسیار مفید باشد. این قابلیت در نسخه صوتی هم برقرار است اما متن بهجای نمایش روی عینک، روی گوشی قابل مشاهده خواهد بود.
– ناوبری مبتنی بر Google Maps: میتوانید با گفتن مقصد (مثلاً «نزدیکترین کافه») مسیر را آغاز کنید؛ نمایشگر مسیرها و دستورالعملهای نوبتبهنوبت را نشان میدهد و برای جهتیابی فضایی میتوانید نگاهی به نقشه بیندازید تا نقطه آبی موقعیتتان را ببینید.
تجربه عملی و محدودیتها
نمونهی آزمایشی نشان داد که عینکها پتانسیل بالایی دارند اما محدودیتهایی هم هست:
– کیفیت صدا: در محیط پرسروصدا صدای پخششده با حداکثر حجم نیز جزئیات بالای هدفونهای باکیفیت را نداشت. برای گوش دادن موسیقی با کیفیت بالا، هدفونهای جداگانه بهترند؛ اما عینک برای شنیدن موسیقی در پیادهروی یا کارهای روزمره مناسب است و مزیت آن حفظ تماس با محیط اطراف است.
– نمایشگر و فوکوس: نمایشگر نمونهی آزمایشی تنها روی چشم راست بود و تصویر کمی مات بهنظر میرسید. برای نویسنده احتمالاً بخشی از این مشکل مربوط به نسخه نمونه و همچنین عینک طبی/لنزهای تجویزی بود. در آزمایش باعث ایجاد خستگی جزئی در ناحیه ابروی راست شد که نیاز به بررسی بیشتر دارد.
– مصرف باتری و پردازش ابری: آزمایش ویدیوی و پردازش تصویر نشان داد که وقتی شبکه شلوغ است (مثل وایفای محل I/O)، پردازش و بازگشت تصاویر و ویرایشهای هوش مصنوعی تا حدود 45 ثانیه طول کشید. این موضوع وابستگی به سرور و شبکه را برجسته میکند.
نکات حریم خصوصی و کنترل کاربر
نسخه نهایی قابلیت تشخیص قرارگیری روی سر و برداشته شدن عینک را خواهد داشت (نمونهی آزمایشی این ویژگی را نداشت). همچنین گوگل اعلام کرده کاربر میتواند انتخاب کند آیا هنگام فعال شدن Gemini دوربین روشن شود یا خیر؛ این سطح از کنترل برای مسائل مربوط به حریم خصوصی اهمیت دارد.
برنامه عرضه و چشمانداز
گوگل میگوید نسخهی صوتی عینکها (audio-only) در پاییز عرضه خواهد شد و نسخهای که نمایشگر درونلنزی دارد در آینده و پس از گسترش برنامهی تسترهای مورد اعتماد (trusted tester) در سال جاری توسعه پیدا خواهد کرد. گوگل معتقد است برای برخی کاربران تجربه صوتی کافی خواهد بود، اما نمایشگر میتواند تجربهای متفاوت و ارزشمندتر برای مواردی مانند ترجمهی زنده، ناوبری سر به سر و ویجتهای بصری فراهم کند.
جمعبندی
عینکهای XR اندروید گوگل گامی مهم در ترکیب هوش مصنوعی با تجربهی دیداری روزمره به شمار میآیند؛ قابلیتهایی مانند ترجمه زنده، ناوبری سربهسر و ویرایش سریع تصاویر با هوش مصنوعی جذاباند. با این حال نسخههای آزمایشی نشان میدهند هنوز چالشهایی در زمینه کیفیت صوتی، راحتی دیداری، مصرف باتری و تاخیر پردازش وجود دارد که باید پیش از عرضهی تجاری برطرف شوند. گوگل وعده داده در ماهها و هفتههای آینده اطلاعات بیشتری بهاشتراک بگذارد؛ برای دنبالکنندگان فناوریهای پوشیدنی و هوش مصنوعی، این محصول یکی از مهمترین مواردی است که باید زیر نظر بگیرند.
