شرکت استارتاپ هوش مصنوعی Stability AI از عرضه مدل جدید خود با نام “Stable Audio Open Small” خبر داده است. این مدل هوش مصنوعی که قادر به تولید صداهای استریو است، به ادعای این شرکت سریعترین مدل تولید صوت در بازار بوده و به اندازهای کارآمد است که میتواند بر روی گوشیهای هوشمند اجرا شود.
Stable Audio Open Small نتیجه همکاری بین Stability AI و شرکت Arm، تولیدکننده تراشههایی است که بسیاری از پردازندههای داخل دستگاههای موبایل از جمله تبلتها و گوشیها را تأمین میکند. در حالی که برخی اپلیکیشنهای مبتنی بر هوش مصنوعی مانند Suno و Udio میتوانند صدا تولید کنند، این نرمافزارها عموماً به پردازش ابری وابستهاند که این امر استفاده آفلاین از آنها را غیرممکن میسازد.
استابلتی همچنین ادعا میکند که مجموعه آموزشی Stable Audio Open Small کاملاً شامل آهنگهای موجود در کتابخانههای صوتی بدون حق امتیاز مانند Free Music Archive و Freesound است. این در حالیست که مجموعههای آموزشی نرمافزارهای Suno و Udio شامل محتوای تحت حق کپیرایت هستند که میتواند خطراتی برای مالکیت معنوی ایجاد کند.
مدل Stable Audio Open Small شامل ۳۴۱ میلیون پارامتر است و بهینهسازی شده برای اجرا بر روی پردازندههای Arm صورت گرفته است. این پارامترها که به عنوان “weights” نیز شناخته میشوند، اجزای داخلی مدل هستند که رفتار آن را هدایت میکنند. این مدل به گونهای طراحی شده که بتواند نمونههای صوتی کوتاه و افکتهای صوتی (مانند ریشههای درام و سازها) را به سرعت تولید کند و ادعا شده است که قادر است تا ۱۱ ثانیه صدا را در کمتر از ۸ ثانیه بر روی گوشیهای هوشمند تولید کند.
با این حال، مدل مزبور محدودیتهایی نیز دارد. Stable Audio Open Small تنها از ابرهای ورودی به زبان انگلیسی پشتیبانی میکند و در مستندات خود ذکر شده است که قابلیت تولید آوازهای واقعی یا آهنگهای با کیفیت بالا را ندارد. همچنین قابلیتهای این مدل در سبکهای موسیقی مختلف به طور یکسان عمل نمیکند که این موضوع ناشی از دادههای برجسته غربی در مجموعه آموزشی آن است.
شرایط استفاده از Stable Audio Open Small نیز برای توسعهدهندگان محدودیتهایی دارد. این مدل برای محققان، سرگرمکنندگان و کسب و کارهایی با درآمد سالیانه کمتر از ۱ میلیون دلار رایگان است، اما توسعهدهندگان و سازمانهایی که بیش از ۱ میلیون دلار درآمد دارند، باید بابت مجوز شرکتی Stability هزینه پرداخت کنند.
شرکت Stability AI که خلفی مدل تصویرسازی محبوب Stable Diffusion است، سال گذشته با جذب سرمایه جدید، تلاش دارد تا این کسب و کار را به مسیر خود بازگرداند. اماد مستعاق، همبنیانگذار و مدیرعامل پیشین Stability به خاطر مدیریت نامناسب به ورشکستگی این شرکت کمک کرد و باعث استعفای کارکنان، عدم تحقق شراکت با Canva و نگرانی سرمایهگذاران از آینده شرکت شد. در ماههای اخیر، Stability مدیرعامل جدیدی استخدام کرده، جیمز کامرون، کارگردان مشهور، را به هیئت مدیره خود منصوب کرده و چندین مدل جدید برای تولید تصویر ارائه کرده است.