آی‌اولا با رونمایی از مدل جدید تشخیص گفتار خود به نام Jargonic به سمت بهبود شرایط استفاده از تشخیص گفتار در محیط‌های واقعی حرکت کرده است. این ابزار که امروز معرفی شد، مخصوص استفاده در محیط‌های صنعتی و تجاری طراحی شده و به طور ویژه برای شناسایی اصطلاحات تخصصی، مقابله با نویز پس‌زمینه و تنوع لهجه بدون نیاز به بازآموزی گسترده بهینه‌سازی شده است.

به گفته‌ی Gill Hetz، معاون هوش مصنوعی آی‌اولا، «مدل ما بر سه چالش اصلی تشخیص گفتار تمرکز دارد: اصطلاحات تخصصی، نویز پس‌زمینه و لهجه‌ها. ما مدلی ساخته‌ایم که به‌طور خودکار و بدون نیاز به آموزش دوباره، اصطلاحات خاص صنعتی را درک می‌کند، در محیط‌های شلوغ به خوبی عملکرد خود را حفظ می‌کند و طیف وسیعی از لهجه‌ها را پشتیبانی می‌کند.»

این ابزار جدید از طریق API در دسترس کسب‌وکارهای حوزه‌هایی نظیر تولید، لجستیک، خدمات مالی و بهداشت قرار گرفته و به عنوان یک راهکار آماده برای تولید به بازار عرضه شده است. Jargonic با بهره‌گیری از سیستم شناسایی کلیدی مخصوص خود، اجازه می‌دهد تا کسب‌وکارها فهرستی از اصطلاحات بدون نیاز به بازآموزی اضافه ارائه دهند.

در آزمایش‌های ابتدایی، Jargonic با میانگین میزان خطای کلمات 5.91٪ در مقایسه با رقبا، نتایج بهتری را ثبت کرده است. اگرچه عملکرد آن در مقایسه با مدل‌های ترنسکریپشن چندمدلی جدیدتر مانند OpenAI’s GPT-4 هنوز منتشر نشده، اما آی‌اولا ادعا می‌کند که مدل آنها در شناسایی اصطلاحات تخصصی کسب‌وکارها بهتر عمل می‌کند.

این ابزار در شناسایی اصطلاحات مالی تخصصی به نرخ 89.3٪ دست یافته و در شناسایی اصطلاحات چندزبانه بیش از 95٪ دقت را نشان داده است. قدرت Jargonic در محیط‌های نویزی و پیچیده از داده‌های بیش از یک میلیون ساعت گفتار پیاده‌سازی‌شده نشأت می‌گیرد.

دیدگاه آی‌اولا این است که تشخیص گفتار به عنوان یک ابزار کسب‌وکار، نقش کلیدی در آینده تعاملات انسان و کامپیوتر خواهد داشت. این شرکت مدعی است که ابزارهای تعاملی صوتی مانند Jargonic به زودی به عنوان رابط اصلی ماشین‌ها مورد استفاده قرار خواهند گرفت و هر دستگاهی قادر خواهد بود به طور طبیعی دستورات صوتی کاربران خود را درک و اجرا کند.

Jargonic اکنون از طریق API برای مشتریان تجاری در دسترس است و به کسب‌وکارها اجازه می‌دهد تا قابلیت‌های تشخیص گفتار این مدل را در فرایندها، برنامه‌ها یا خدمات مشتری‌محور خود یکپارچه کنند.

تبدیل صوت به متن با هوش مصنوعی

دیدگاه‌ خود را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

اسکرول به بالا