شرکت استارتاپ هوش مصنوعی Stability AI از عرضه مدل جدید خود با نام “Stable Audio Open Small” خبر داده است. این مدل هوش مصنوعی که قادر به تولید صداهای استریو است، به ادعای این شرکت سریع‌ترین مدل تولید صوت در بازار بوده و به اندازه‌ای کارآمد است که می‌تواند بر روی گوشی‌های هوشمند اجرا شود.

Stable Audio Open Small نتیجه همکاری بین Stability AI و شرکت Arm، تولیدکننده تراشه‌هایی است که بسیاری از پردازنده‌های داخل دستگاه‌های موبایل از جمله تبلت‌ها و گوشی‌ها را تأمین می‌کند. در حالی که برخی اپلیکیشن‌های مبتنی بر هوش مصنوعی مانند Suno و Udio می‌توانند صدا تولید کنند، این نرم‌افزارها عموماً به پردازش ابری وابسته‌اند که این امر استفاده آفلاین از آنها را غیرممکن می‌سازد.

استابلتی همچنین ادعا می‌کند که مجموعه آموزشی Stable Audio Open Small کاملاً شامل آهنگ‌های موجود در کتابخانه‌های صوتی بدون حق امتیاز مانند Free Music Archive و Freesound است. این در حالیست که مجموعه‌های آموزشی نرم‌افزارهای Suno و Udio شامل محتوای تحت حق کپی‌رایت هستند که می‌تواند خطراتی برای مالکیت معنوی ایجاد کند.

مدل Stable Audio Open Small شامل ۳۴۱ میلیون پارامتر است و بهینه‌سازی شده برای اجرا بر روی پردازنده‌های Arm صورت گرفته است. این پارامترها که به عنوان “weights” نیز شناخته می‌شوند، اجزای داخلی مدل هستند که رفتار آن را هدایت می‌کنند. این مدل به گونه‌ای طراحی شده که بتواند نمونه‌های صوتی کوتاه و افکت‌های صوتی (مانند ریشه‌های درام و سازها) را به سرعت تولید کند و ادعا شده است که قادر است تا ۱۱ ثانیه صدا را در کمتر از ۸ ثانیه بر روی گوشی‌های هوشمند تولید کند.

با این حال، مدل مزبور محدودیت‌هایی نیز دارد. Stable Audio Open Small تنها از ابرهای ورودی به زبان انگلیسی پشتیبانی می‌کند و در مستندات خود ذکر شده است که قابلیت تولید آوازهای واقعی یا آهنگ‌های با کیفیت بالا را ندارد. همچنین قابلیت‌های این مدل در سبک‌های موسیقی مختلف به طور یکسان عمل نمی‌کند که این موضوع ناشی از داده‌های برجسته‌ غربی در مجموعه آموزشی آن است.

شرایط استفاده از Stable Audio Open Small نیز برای توسعه‌دهندگان محدودیت‌هایی دارد. این مدل برای محققان، سرگرم‌کنندگان و کسب و کارهایی با درآمد سالیانه کمتر از ۱ میلیون دلار رایگان است، اما توسعه‌دهندگان و سازمان‌هایی که بیش از ۱ میلیون دلار درآمد دارند، باید بابت مجوز شرکتی Stability هزینه پرداخت کنند.

شرکت Stability AI که خلفی مدل تصویرسازی محبوب Stable Diffusion است، سال گذشته با جذب سرمایه جدید، تلاش دارد تا این کسب و کار را به مسیر خود بازگرداند. اماد مستعاق، هم‌بنیان‌گذار و مدیرعامل پیشین Stability به خاطر مدیریت نامناسب به ورشکستگی این شرکت کمک کرد و باعث استعفای کارکنان، عدم تحقق شراکت با Canva و نگرانی سرمایه‌گذاران از آینده شرکت شد. در ماه‌های اخیر، Stability مدیرعامل جدیدی استخدام کرده، جیمز کامرون، کارگردان مشهور، را به هیئت مدیره خود منصوب کرده و چندین مدل جدید برای تولید تصویر ارائه کرده است.

تولید تصویر با هوش مصنوعی

دیدگاه‌ خود را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

اسکرول به بالا