استارتاپ Audio Krisp از ویژگی جدیدی رونمایی کرد: تغییر لهجه کاربران با استفاده از هوش مصنوعی
استارتاپ مطرح Krisp، روز چهارشنبه اعلام کرد که ویژگی جدیدی مبتنی بر هوش مصنوعی را به پلتفرم خود اضافه کرده است که میتواند لهجه کاربران را در مکالمات تلفنی تغییر دهد. این قابلیت در حال حاضر امکان تبدیل لهجه انگلیسی هندی به انگلیسی آمریکایی را فراهم میآورد، و بهزودی برای زبانها و لهجههای بیشتری ارائه خواهد شد.
فناوری پیشرفته تغییر لهجه چگونه کار میکند؟
طبق اعلام Krisp، فرآیند تغییر لهجه به گونهای طراحی شده که صدای گوینده اصلی حفظ شود و تنها فونمها بهطور هوشمند تغییر کنند تا با لهجه آمریکایی مطابقت داشته باشند. این ویژگی به صورت آزمایشی در محیطهای تجاری مورد استفاده قرار گرفته است و اکنون نسخه بتا آن در اپلیکیشن دسکتاپ Krisp در دسترس کاربران قرار گرفته است. کاربران میتوانند این قابلیت را قبل یا در حین تماس فعال کنند.
الهامبخش توسعه این قابلیت
آرتو میناسیان، یکی از بنیانگذاران Krisp، در این باره گفت: «ایده این قابلیت زمانی به ذهنم رسید که متوجه شدم بسیاری از افراد به دلیل لهجه متفاوت، نمیتوانند صحبتهای من را بهخوبی درک کنند، هرچند که تسلط کافی بر زبان انگلیسی دارم. به همین دلیل تصور کردم که تغییر لهجه میتواند باعث بهبود ارتباطات شود. ما کار روی این فناوری را دو سال پیش آغاز کردیم و اکنون نسخه بتای آن را منتشر کردهایم.»
چالشها و وعدههای آینده فناوری
هرچند این ویژگی در مراحل اولیه عرضه خود قرار دارد، اما برخی کاربران در تستهای اولیه گزارش دادهاند که صدای پردازششده در مواردی طبیعی به نظر نمیرسد و حتی گاهی برخی کلمات از دست میروند. شرکت Krisp این مشکلات را به ماهیت نسخه بتا نسبت داده و وعده داده است که مدل هوش مصنوعی با گذشت زمان و جمعآوری دادههای بیشتر بهبود خواهد یافت.
تأثیر کاربردی فناوری در محیطهای تجاری
طبق آزمایشهای Krisp، پیادهسازی این قابلیت در محیطهای تجاری منجر به افزایش قابلتوجه در نرخ تبدیل فروش (26.1%) و رشد درآمد هر جلسه (14.8%) شده است. دلیل تمرکز اولیه روی لهجههای هندی نیز سهم بالای متخصصان هندی در نیروی کار جهانی در زمینههای STEM عنوان شده است. این شرکت خاطرنشان میکند که در آینده لهجههای بیشتری از جمله فیلیپینی به این قابلیت اضافه خواهند شد.
سایر جزئیات و برنامههای آینده Krisp
این فناوری بر پایه هزاران نمونه صوتی از لهجهها و گویشهای مختلف آموزش دیده است و دادههای مورد استفاده از دستیار ملاقاتهای این شرکت با رضایت کاربران جمعآوری شدهاند. ویژگی تغییر لهجه نیازی به پیشآموزش روی صدای کاربر ندارد و یک نمایه صوتی از گوینده را به صورت آنی ایجاد میکند.
Krisp اعلام کرده است که قصد دارد تا پایان سال جاری اپلیکیشنهای iOS و Android خود را برای پشتیبانی از جلسات حضوری عرضه کند. همچنین برنامههایی برای ارائه افزونهای جدید در مرورگر کروم به منظور ارتقای تجربه کاربری در Google Meet در حال انجام است.
رقابت در دنیای فناوری تغییر لهجه
شرکتهای دیگری مانند Sanas که از سوی GV حمایت میشود نیز فناوریهای مشابهی را در مقیاس کلان برای مراکز تماس ارائه دادهاند. این رقابت نشان میدهد که تغییر لهجه مبتنی بر هوش مصنوعی میتواند به یکی از نوآوریهای تحولآفرین در ارتباطات جهانی تبدیل شود.
سایت بینا ویرا با انتشار این خبر، به بررسی بیشتر این فناوریها و تاثیر آنها در جهان مشاغل و ارتباطات خواهد پرداخت. منتظر اخبار بیشتر در این زمینه از بخش اخبار بینا ویرا باشید!