گوگل در روز پنج‌شنبه اعلام کرد که قابلیت‌های جدید هوش مصنوعی و دسترسی‌پذیری را برای سیستم‌عامل اندروید و مرورگر کروم راه‌اندازی کرده است. یکی از ویژگی‌های برجسته، به‌روزرسانی TalkBack، خواننده صفحه اندروید است که به کاربران این امکان را می‌دهد تا از Gemini در مورد محتوای تصاویر و آنچه بر روی صفحه نمایش آن‌ها است، سوال بپرسند. سال گذشته، گوگل قابلیت‌های Gemini را به TalkBack اضافه کرد تا افراد نابینا یا کم‌بینایی که به توصیف‌های تولید شده توسط هوش مصنوعی برای تصاویر دسترسی پیدا کنند، حتی زمانی که متن جایگزین (Alt text) وجود ندارد.

اکنون، کاربران می‌توانند در مورد تصاویر خود سوال کنند و پاسخ‌های مربوطه را دریافت کنند. به عنوان مثال، اگر دوستی عکسی از گیتار جدیدش برای شما ارسال کند، شما می‌توانید توصیفی از آن دریافت کرده و در مورد برند و رنگ آن سوال کنید. علاوه بر این، امکان دریافت توصیف و پرسش درباره کل صفحه نمایش گوشی نیز فراهم شده است. به‌عنوان مثال، هنگام خرید در یک اپلیکیشن، می‌توانید از Gemini بپرسید که جنس کالای مورد نظر چیست یا آیا تخفیفی وجود دارد.

گوگل همچنین امروز از به‌روزرسانی “Expressive Captions” خبر داد، که ویژگی زیرنویس‌های زمان واقعی در اندروید است و از فناوری هوش مصنوعی برای ثبت آنچه یک فرد می‌گوید و نحوه بیان آن استفاده می‌کند. گوگل متوجه شده است که یکی از راه‌های ابراز احساسات افراد، کشیدن صداهای کلمات است و به همین دلیل ویژگی جدیدی به نام “مدت زمان” به Expressive Captions اضافه کرده است. اکنون با این ویژگی، شما می‌دانید که یک گزارشگر ورزشی از اصطلاح “ضربه فوق‌العاده” استفاده می‌کند یا وقتی کسی نمی‌گوید “نه” بلکه “نه‌ههه.”

به‌علاوه، برچسب‌های جدیدی برای صداها معرفی شده است، مانند زمانی که یک فرد سوت می‌زند یا گلویش را صاف می‌کند. این به‌روزرسانی به زبان انگلیسی در ایالات متحده، بریتانیا، کانادا و استرالیا برای دستگاه‌های دارای Android 15 و بالاتر در حال عرضه است.

همچنین، گوگل دسترسی به فایل‌های PDF را در مرورگر کروم آسان‌تر کرده است. پیش از این، کاربران نمی‌توانستند با خواننده صفحه خود با یک PDF اسکن شده در مرورگر دسکتاپ کروم تعامل داشته باشند، اما اکنون کروم به‌طور خودکار این نوع PDFها را شناسایی می‌کند و به کاربران امکان می‌دهد متون را هایلایت، کپی و جستجو کنند؛ درست مانند هر صفحه دیگری. این قابلیت به لطف معرفی فناوری شناسایی کاراکتر نوری (OCR) انجام شده است. علاوه بر این، قابلیت بزرگنمایی صفحات در کروم برای اندروید اکنون به کاربران این امکان را می‌دهد که اندازه متن را بدون تغییر در طراحی صفحه وب افزایش دهند. شما می‌توانید تنظیم کنید که چقدر بزرگنمایی را می‌خواهید و سپس انتخاب کنید که این تنظیمات را برای تمامی صفحات مشاهده شده یا فقط صفحات خاصی اعمال کنید. با ضربه زدن بر روی منوی سه نقطه‌ای در گوشه بالای راست کروم می‌توانید به این ویژگی دسترسی پیدا کنید.

خوانش متن با صدای طبیعی

دیدگاه‌ خود را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

اسکرول به بالا