آیاولا با رونمایی از مدل جدید تشخیص گفتار خود به نام Jargonic به سمت بهبود شرایط استفاده از تشخیص گفتار در محیطهای واقعی حرکت کرده است. این ابزار که امروز معرفی شد، مخصوص استفاده در محیطهای صنعتی و تجاری طراحی شده و به طور ویژه برای شناسایی اصطلاحات تخصصی، مقابله با نویز پسزمینه و تنوع لهجه بدون نیاز به بازآموزی گسترده بهینهسازی شده است.
به گفتهی Gill Hetz، معاون هوش مصنوعی آیاولا، «مدل ما بر سه چالش اصلی تشخیص گفتار تمرکز دارد: اصطلاحات تخصصی، نویز پسزمینه و لهجهها. ما مدلی ساختهایم که بهطور خودکار و بدون نیاز به آموزش دوباره، اصطلاحات خاص صنعتی را درک میکند، در محیطهای شلوغ به خوبی عملکرد خود را حفظ میکند و طیف وسیعی از لهجهها را پشتیبانی میکند.»
این ابزار جدید از طریق API در دسترس کسبوکارهای حوزههایی نظیر تولید، لجستیک، خدمات مالی و بهداشت قرار گرفته و به عنوان یک راهکار آماده برای تولید به بازار عرضه شده است. Jargonic با بهرهگیری از سیستم شناسایی کلیدی مخصوص خود، اجازه میدهد تا کسبوکارها فهرستی از اصطلاحات بدون نیاز به بازآموزی اضافه ارائه دهند.
در آزمایشهای ابتدایی، Jargonic با میانگین میزان خطای کلمات 5.91٪ در مقایسه با رقبا، نتایج بهتری را ثبت کرده است. اگرچه عملکرد آن در مقایسه با مدلهای ترنسکریپشن چندمدلی جدیدتر مانند OpenAI’s GPT-4 هنوز منتشر نشده، اما آیاولا ادعا میکند که مدل آنها در شناسایی اصطلاحات تخصصی کسبوکارها بهتر عمل میکند.
این ابزار در شناسایی اصطلاحات مالی تخصصی به نرخ 89.3٪ دست یافته و در شناسایی اصطلاحات چندزبانه بیش از 95٪ دقت را نشان داده است. قدرت Jargonic در محیطهای نویزی و پیچیده از دادههای بیش از یک میلیون ساعت گفتار پیادهسازیشده نشأت میگیرد.
دیدگاه آیاولا این است که تشخیص گفتار به عنوان یک ابزار کسبوکار، نقش کلیدی در آینده تعاملات انسان و کامپیوتر خواهد داشت. این شرکت مدعی است که ابزارهای تعاملی صوتی مانند Jargonic به زودی به عنوان رابط اصلی ماشینها مورد استفاده قرار خواهند گرفت و هر دستگاهی قادر خواهد بود به طور طبیعی دستورات صوتی کاربران خود را درک و اجرا کند.
Jargonic اکنون از طریق API برای مشتریان تجاری در دسترس است و به کسبوکارها اجازه میدهد تا قابلیتهای تشخیص گفتار این مدل را در فرایندها، برنامهها یا خدمات مشتریمحور خود یکپارچه کنند.