تأسیس Phonic: تحولی جدید در فناوری صدای مصنوعی
فناوری تولید صوت مصنوعی با استفاده از هوش مصنوعی، در سالهای اخیر پیشرفت قابل توجهی داشته است و اکنون کیفیت این صداها برای استفادههایی نظیر تولید کتابهای صوتی، پادکستها، خواندن مقالات برای کاربران و ارائه خدمات مشتریان پایه مناسب است. با این حال، بسیاری از کسبوکارها هنوز فناوری صوتی مبتنی بر هوش مصنوعی را به اندازه کافی قابل اعتماد برای استفاده در مقیاسهای بزرگ نمیدانند.
برای حل این چالش، دو فارغالتحصیل مؤسسه فناوری ماساچوست (MIT)، معین ندیم و نیکیل مورتی، تصمیم به تأسیس شرکت Phonic گرفتند. این شرکت نوآورانه، یک راهکار جامع فناوری صوتی ارائه میدهد تا قابلیت اعتماد صداهای مصنوعی را افزایش دهد و در عین حال، تأخیر در فرآیندهای مربوطه را کاهش دهد.
دیدگاه مؤسسین Phonic درباره نیاز بازار
ندیم و مورتی که بیش از هفت سال با یکدیگر آشنایی دارند، مشکلات موجود در بازار فناوری صوتی را هنگام شروع فعالیت خود در سال گذشته به خوبی شناسایی کردند. به گفته مورتی، راهحلهای موجود در این حوزه معمولاً بر اتصال اجزای مختلف مانند تبدیل متن به گفتار و شناسایی خودکار صداها تمرکز دارند و اغلب فاقد یکپارچگی و قابلیت اعتماد مناسب در مقیاسهای بزرگ هستند.
معین ندیم، که تجربه کاری در MosaicML (شرکتی که در سال ۲۰۲۳ توسط Databricks با مبلغ ۱.۳ میلیارد دلار خریداری شد) را در رزومه خود دارد، معتقد است که بسیاری از شرکتها در این حوزه تنها به ایجاد جریانهای کاری برای پیوند دادن مدلهای مختلف هوش مصنوعی متکی هستند. اما Phonic رویکرد متفاوتی اتخاذ کرده است: آموزش مدلها بهصورت کاملاً داخلی و مبتنی بر نیاز واقعی بازار.
مزیت روش داخلی Phonic
مورتی درباره مزایای این رویکرد توضیح میدهد: «مالکیت مدلها به ما این امکان را میدهد که قابلیتهای اعتمادپذیری را به طور عمیق در خود مدلها ادغام کنیم. اگر شما لایههای مختلف فناوری را در مالکیت خود نداشته باشید، تنها قطعات جداگانهای را به یکدیگر متصل میکنید که هماهنگی کاملی ندارند.»
به گفته وی، روش داخلی Phonic نه تنها یکپارچگی بیشتری ایجاد میکند بلکه به شرکت امکان میدهد مدلها را با هزینه کمتر میزبانی و اجرا کند. همچنین این مدلها با استفاده از انواع ضبطهای متفاوت مانند صداهای لهجهدار یا کمکیفیت آموزش داده میشوند تا قابلیت اطمینان آنها به حداکثر برسد.
همکاریها و برنامههای آینده
Phonic اکنون با تعداد محدودی از شرکای تجاری در حوزههای بیمه و سلامت همکاری میکند و در نظر دارد محصول خود را طی چند ماه آینده به صورت عمومی عرضه کند. معین ندیم اعلام کرده است که به زودی مشتریان بالقوه میتوانند فناوری صوتی این شرکت را از طریق وبسایت رسمی آن امتحان کنند.
سرمایهگذاری و حمایت از Phonic
این شرکت در مرحله سرمایهگذاری بذری موفق به جذب ۴ میلیون دلار گردید. این سرمایهگذاری توسط Lux Capital با مشارکت بنیانگذاران رپلایت (Replit)، هاجینگ فیس (Hugging Face)، آپلاید اینتویشن (Applied Intuition) و Modal Labs انجام شد.
گریس ایسفورد، یکی از شرکای سرمایهگذاری Lux Capital، درباره دلیل حمایت از این شرکت گفت: «رویکرد آموزشی داخلی Phonic و استفاده از ترکیب مدلهای پراپریتی و دیفیوژن در فناوری صوتی هوش مصنوعی بسیار نوآورانه است. علاوه بر این، باور ما به تواناییهای تکنولوژیکی معین و نیکیل و سابقه درخشان آنها در آموزش مدلها از عوامل کلیدی تصمیم ما بود.»
جمعبندی
شرکت Phonic با تلاش برای حل مشکلات موجود در فناوری صوت مصنوعی، مسیر جدیدی را در این حوزه باز کرده است. با رویکرد داخلی و یکپارچه این شرکت و حمایت مالی قدرتمند، به نظر میرسد که آیندهای روشن در انتظار نوآوریهای Phonic در عرصه هوش مصنوعی باشد.
برای دریافت اطلاعات بیشتر درباره فناوریهای صوتی شرکت، منتظر عرضه عمومی محصول آنها از طریق وبسایت Phonic باشید.