تأسیس Phonic: تحولی جدید در فناوری صدای مصنوعی

فناوری تولید صوت مصنوعی با استفاده از هوش مصنوعی، در سال‌های اخیر پیشرفت قابل توجهی داشته است و اکنون کیفیت این صداها برای استفاده‌هایی نظیر تولید کتاب‌های صوتی، پادکست‌ها، خواندن مقالات برای کاربران و ارائه خدمات مشتریان پایه مناسب است. با این حال، بسیاری از کسب‌وکارها هنوز فناوری صوتی مبتنی بر هوش مصنوعی را به اندازه کافی قابل اعتماد برای استفاده در مقیاس‌های بزرگ نمی‌دانند.

برای حل این چالش، دو فارغ‌التحصیل مؤسسه فناوری ماساچوست (MIT)، معین ندیم و نیکیل مورتی، تصمیم به تأسیس شرکت Phonic گرفتند. این شرکت نوآورانه، یک راهکار جامع فناوری صوتی ارائه می‌دهد تا قابلیت اعتماد صداهای مصنوعی را افزایش دهد و در عین حال، تأخیر در فرآیندهای مربوطه را کاهش دهد.

دیدگاه مؤسسین Phonic درباره نیاز بازار

ندیم و مورتی که بیش از هفت سال با یکدیگر آشنایی دارند، مشکلات موجود در بازار فناوری صوتی را هنگام شروع فعالیت خود در سال گذشته به خوبی شناسایی کردند. به‌ گفته مورتی، راه‌حل‌های موجود در این حوزه معمولاً بر اتصال اجزای مختلف مانند تبدیل متن به گفتار و شناسایی خودکار صداها تمرکز دارند و اغلب فاقد یکپارچگی و قابلیت اعتماد مناسب در مقیاس‌های بزرگ هستند.

معین ندیم، که تجربه کاری در MosaicML (شرکتی که در سال ۲۰۲۳ توسط Databricks با مبلغ ۱.۳ میلیارد دلار خریداری شد) را در رزومه خود دارد، معتقد است که بسیاری از شرکت‌ها در این حوزه تنها به ایجاد جریان‌های کاری برای پیوند دادن مدل‌های مختلف هوش مصنوعی متکی هستند. اما Phonic رویکرد متفاوتی اتخاذ کرده است: آموزش مدل‌ها به‌صورت کاملاً داخلی و مبتنی بر نیاز واقعی بازار.

مزیت روش داخلی Phonic

مورتی درباره مزایای این رویکرد توضیح می‌دهد: «مالکیت مدل‌ها به ما این امکان را می‌دهد که قابلیت‌های اعتمادپذیری را به طور عمیق در خود مدل‌ها ادغام کنیم. اگر شما لایه‌های مختلف فناوری را در مالکیت خود نداشته باشید، تنها قطعات جداگانه‌ای را به یکدیگر متصل می‌کنید که هماهنگی کاملی ندارند.»

به گفته وی، روش داخلی Phonic نه تنها یکپارچگی بیشتری ایجاد می‌کند بلکه به شرکت امکان می‌دهد مدل‌ها را با هزینه کمتر میزبانی و اجرا کند. همچنین این مدل‌ها با استفاده از انواع ضبط‌های متفاوت مانند صداهای لهجه‌دار یا کم‌کیفیت آموزش داده می‌شوند تا قابلیت اطمینان آن‌ها به حداکثر برسد.

همکاری‌ها و برنامه‌های آینده

Phonic اکنون با تعداد محدودی از شرکای تجاری در حوزه‌های بیمه و سلامت همکاری می‌کند و در نظر دارد محصول خود را طی چند ماه آینده به صورت عمومی عرضه کند. معین ندیم اعلام کرده است که به زودی مشتریان بالقوه می‌توانند فناوری صوتی این شرکت را از طریق وب‌سایت رسمی آن امتحان کنند.

سرمایه‌گذاری و حمایت از Phonic

این شرکت در مرحله سرمایه‌گذاری بذری موفق به جذب ۴ میلیون دلار گردید. این سرمایه‌گذاری توسط Lux Capital با مشارکت بنیان‌گذاران رپلایت (Replit)، هاجینگ فیس (Hugging Face)، آپلاید اینتویشن (Applied Intuition) و Modal Labs انجام شد.

گریس ایسفورد، یکی از شرکای سرمایه‌گذاری Lux Capital، درباره دلیل حمایت از این شرکت گفت: «رویکرد آموزشی داخلی Phonic و استفاده از ترکیب مدل‌های پراپریتی و دیفیوژن در فناوری صوتی هوش مصنوعی بسیار نوآورانه است. علاوه بر این، باور ما به توانایی‌های تکنولوژیکی معین و نیکیل و سابقه درخشان آن‌ها در آموزش مدل‌ها از عوامل کلیدی تصمیم ما بود.»

جمع‌بندی

شرکت Phonic با تلاش برای حل مشکلات موجود در فناوری صوت مصنوعی، مسیر جدیدی را در این حوزه باز کرده است. با رویکرد داخلی و یکپارچه این شرکت و حمایت مالی قدرتمند، به نظر می‌رسد که آینده‌ای روشن در انتظار نوآوری‌های Phonic در عرصه هوش مصنوعی باشد.

برای دریافت اطلاعات بیشتر درباره فناوری‌های صوتی شرکت، منتظر عرضه عمومی محصول آن‌ها از طریق وب‌سایت Phonic باشید.

تبدیل متن به صوت با هوش مصنوعی

دیدگاه‌ خود را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

اسکرول به بالا