گوگل در روز پنجشنبه اعلام کرد که قابلیتهای جدید هوش مصنوعی و دسترسیپذیری را برای سیستمعامل اندروید و مرورگر کروم راهاندازی کرده است. یکی از ویژگیهای برجسته، بهروزرسانی TalkBack، خواننده صفحه اندروید است که به کاربران این امکان را میدهد تا از Gemini در مورد محتوای تصاویر و آنچه بر روی صفحه نمایش آنها است، سوال بپرسند. سال گذشته، گوگل قابلیتهای Gemini را به TalkBack اضافه کرد تا افراد نابینا یا کمبینایی که به توصیفهای تولید شده توسط هوش مصنوعی برای تصاویر دسترسی پیدا کنند، حتی زمانی که متن جایگزین (Alt text) وجود ندارد.
اکنون، کاربران میتوانند در مورد تصاویر خود سوال کنند و پاسخهای مربوطه را دریافت کنند. به عنوان مثال، اگر دوستی عکسی از گیتار جدیدش برای شما ارسال کند، شما میتوانید توصیفی از آن دریافت کرده و در مورد برند و رنگ آن سوال کنید. علاوه بر این، امکان دریافت توصیف و پرسش درباره کل صفحه نمایش گوشی نیز فراهم شده است. بهعنوان مثال، هنگام خرید در یک اپلیکیشن، میتوانید از Gemini بپرسید که جنس کالای مورد نظر چیست یا آیا تخفیفی وجود دارد.
گوگل همچنین امروز از بهروزرسانی “Expressive Captions” خبر داد، که ویژگی زیرنویسهای زمان واقعی در اندروید است و از فناوری هوش مصنوعی برای ثبت آنچه یک فرد میگوید و نحوه بیان آن استفاده میکند. گوگل متوجه شده است که یکی از راههای ابراز احساسات افراد، کشیدن صداهای کلمات است و به همین دلیل ویژگی جدیدی به نام “مدت زمان” به Expressive Captions اضافه کرده است. اکنون با این ویژگی، شما میدانید که یک گزارشگر ورزشی از اصطلاح “ضربه فوقالعاده” استفاده میکند یا وقتی کسی نمیگوید “نه” بلکه “نهههه.”
بهعلاوه، برچسبهای جدیدی برای صداها معرفی شده است، مانند زمانی که یک فرد سوت میزند یا گلویش را صاف میکند. این بهروزرسانی به زبان انگلیسی در ایالات متحده، بریتانیا، کانادا و استرالیا برای دستگاههای دارای Android 15 و بالاتر در حال عرضه است.
همچنین، گوگل دسترسی به فایلهای PDF را در مرورگر کروم آسانتر کرده است. پیش از این، کاربران نمیتوانستند با خواننده صفحه خود با یک PDF اسکن شده در مرورگر دسکتاپ کروم تعامل داشته باشند، اما اکنون کروم بهطور خودکار این نوع PDFها را شناسایی میکند و به کاربران امکان میدهد متون را هایلایت، کپی و جستجو کنند؛ درست مانند هر صفحه دیگری. این قابلیت به لطف معرفی فناوری شناسایی کاراکتر نوری (OCR) انجام شده است. علاوه بر این، قابلیت بزرگنمایی صفحات در کروم برای اندروید اکنون به کاربران این امکان را میدهد که اندازه متن را بدون تغییر در طراحی صفحه وب افزایش دهند. شما میتوانید تنظیم کنید که چقدر بزرگنمایی را میخواهید و سپس انتخاب کنید که این تنظیمات را برای تمامی صفحات مشاهده شده یا فقط صفحات خاصی اعمال کنید. با ضربه زدن بر روی منوی سه نقطهای در گوشه بالای راست کروم میتوانید به این ویژگی دسترسی پیدا کنید.