عینک‌های هوش مصنوعی گوگل با نمایشگر درون‌لنزی: تجربه اولیه و چشم‌انداز پیش‌رو

در جریان کنفرانس توسعه‌دهندگان Google I/O این هفته، فرصتی دست داد تا به‌صورت کوتاه با نمونه‌ی اولیه عینک‌های هوش مصنوعی گوگل که تجربه‌ای ترکیبی از صوت و تصویر ارائه می‌دهند کار کنیم. این گجت که سال گذشته معرفی شد، از نمایشگر درون‌لنزی (in-lens display) بهره می‌برد و اطلاعات کاربردی را به‌صورت لایه‌ای روی دنیای واقعی نمایش می‌دهد؛ از نمایش وضعیت آب‌وهوا و مسیرهای پیاده‌روی تا ترجمه‌ی زنده و ویجت‌های سفارشی شده توسط هوش مصنوعی.

همکاری طراحی و وضعیت نمونه‌ی اولیه
گوگل این عینک‌ها را با همکاری برندهایی چون Warby Parker، Gentle Monster و سامسونگ توسعه داده تا فناوری خود را در قالب طراحی‌های تجاری آن‌ها عرضه کند. نمونه‌ای که در I/O دیده شد هنوز پروتوتایپ است؛ به عبارت دیگر تمرکز روی آزمایش فناوری نمایشگر و تاثیر آن روی مصرف باتری بوده و جزئیات ظاهری و انواع فریم‌ها در این نمونه نهایی نشده‌اند. بنابراین نسخه تجاری احتمالا از لحاظ فیت و جزئیات ظاهری تفاوت قابل توجهی خواهد داشت.

ویژگی‌های کلیدی
– نمایشگر درون‌لنزی و ویجت‌ها: ویجت‌هایی مانند مسیرهای پیاده‌روی، اطلاعات اوبر، ترجمه زنده و اطلاعات روزانه قابل نمایش خواهند بود؛ حتی امکان ساخت ویجت‌های سفارشی با کمک هوش مصنوعی پیش‌بینی شده است.
– سازگاری با اندروید و iOS: گوگل اعلام کرده عینک‌ها هم با گوشی‌های اندروید و هم با آیفون سازگار خواهند بود، چه در نسخه صوتی و چه در نسخه‌ای که نمایشگر دارد.
– دستیار Gemini: با فشردن دو ثانیه‌ای روی قسمت راست فریم، دستیار Gemini فعال شده و به فرمان صوتی گوش می‌دهد. در نمونه‌ی نمایشی، فعال‌سازی Gemini هم‌زمان دوربین را روشن می‌کرد؛ اما نسخه نهایی اجازه می‌دهد این رفتار را کاربر تنظیم کند.
– عکاسی و ویرایش مبتنی بر هوش مصنوعی: گرفتن عکس با دکمه یا فرمان صوتی ممکن است. کاربر می‌تواند از Gemini بخواهد عکس را ویرایش کند (مثلاً تبدیل چهره به سبک انیمه)؛ پردازش تصویر از طریق سرورهای Gemini و سرویس‌های مرتبط انجام می‌شود و بسته به کیفیت شبکه می‌تواند تا حدود چند ده ثانیه طول بکشد.
– ترجمه و زیرنویس زنده: یکی از جذاب‌ترین دموی‌ها ترجمه‌ی همزمان بود؛ عینک زبان صحبت‌شده را تشخیص داده و متن ترجمه‌شده را نمایش داده و Gemini صدای ترجمه را پخش می‌کند. تجربه‌ای که می‌تواند برای مسافران بین‌المللی بسیار مفید باشد. این قابلیت در نسخه صوتی هم برقرار است اما متن به‌جای نمایش روی عینک، روی گوشی قابل مشاهده خواهد بود.
– ناوبری مبتنی بر Google Maps: می‌توانید با گفتن مقصد (مثلاً «نزدیک‌ترین کافه») مسیر را آغاز کنید؛ نمایشگر مسیرها و دستورالعمل‌های نوبت‌به‌نوبت را نشان می‌دهد و برای جهت‌یابی فضایی می‌توانید نگاهی به نقشه بیندازید تا نقطه آبی موقعیت‌تان را ببینید.

تجربه عملی و محدودیت‌ها
نمونه‌ی آزمایشی نشان داد که عینک‌ها پتانسیل بالایی دارند اما محدودیت‌هایی هم هست:
– کیفیت صدا: در محیط پرسروصدا صدای پخش‌شده با حداکثر حجم نیز جزئیات بالای هدفون‌های باکیفیت را نداشت. برای گوش دادن موسیقی با کیفیت بالا، هدفون‌های جداگانه بهترند؛ اما عینک برای شنیدن موسیقی در پیاده‌روی یا کارهای روزمره مناسب است و مزیت آن حفظ تماس با محیط اطراف است.
– نمایشگر و فوکوس: نمایشگر نمونه‌ی آزمایشی تنها روی چشم راست بود و تصویر کمی مات به‌نظر می‌رسید. برای نویسنده احتمالاً بخشی از این مشکل مربوط به نسخه نمونه و همچنین عینک طبی/لنزهای تجویزی بود. در آزمایش باعث ایجاد خستگی جزئی در ناحیه ابروی راست شد که نیاز به بررسی بیشتر دارد.
– مصرف باتری و پردازش ابری: آزمایش ویدیوی و پردازش تصویر نشان داد که وقتی شبکه شلوغ است (مثل وای‌فای محل I/O)، پردازش و بازگشت تصاویر و ویرایش‌های هوش مصنوعی تا حدود 45 ثانیه طول کشید. این موضوع وابستگی به سرور و شبکه را برجسته می‌کند.

نکات حریم خصوصی و کنترل کاربر
نسخه نهایی قابلیت تشخیص قرارگیری روی سر و برداشته شدن عینک را خواهد داشت (نمونه‌ی آزمایشی این ویژگی را نداشت). همچنین گوگل اعلام کرده کاربر می‌تواند انتخاب کند آیا هنگام فعال شدن Gemini دوربین روشن شود یا خیر؛ این سطح از کنترل برای مسائل مربوط به حریم خصوصی اهمیت دارد.

برنامه عرضه و چشم‌انداز
گوگل می‌گوید نسخه‌ی صوتی عینک‌ها (audio-only) در پاییز عرضه خواهد شد و نسخه‌ای که نمایشگر درون‌لنزی دارد در آینده و پس از گسترش برنامه‌ی تسترهای مورد اعتماد (trusted tester) در سال جاری توسعه پیدا خواهد کرد. گوگل معتقد است برای برخی کاربران تجربه صوتی کافی خواهد بود، اما نمایشگر می‌تواند تجربه‌ای متفاوت و ارزشمندتر برای مواردی مانند ترجمه‌ی زنده، ناوبری سر به سر و ویجت‌های بصری فراهم کند.

جمع‌بندی
عینک‌های XR اندروید گوگل گامی مهم در ترکیب هوش مصنوعی با تجربه‌ی دیداری روزمره به شمار می‌آیند؛ قابلیت‌هایی مانند ترجمه زنده، ناوبری سربه‌سر و ویرایش سریع تصاویر با هوش مصنوعی جذاب‌اند. با این حال نسخه‌های آزمایشی نشان می‌دهند هنوز چالش‌هایی در زمینه کیفیت صوتی، راحتی دیداری، مصرف باتری و تاخیر پردازش وجود دارد که باید پیش از عرضه‌ی تجاری برطرف شوند. گوگل وعده داده در ماه‌ها و هفته‌های آینده اطلاعات بیشتری به‌اشتراک بگذارد؛ برای دنبال‌کنندگان فناوری‌های پوشیدنی و هوش مصنوعی، این محصول یکی از مهم‌ترین مواردی است که باید زیر نظر بگیرند.

سرویس ویرایش عکس هوش مصنوعی

دیدگاه‌ خود را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

اسکرول به بالا