تیم Moonvalley، استارتاپ تولید ویدیو با هوش مصنوعی مستقر در لس آنجلس، بر این باور است که نمیتوان تنها با استفاده از دستورالعملها به تولید فیلم پرداخت. به همین خاطر، این شرکت روز سهشنبه مدل “آگاه از سه بعدی” خود را برای عموم آزاد کرد و وعده رویکردی “ترکیبی” را داد که به فیلمسازان کنترل بیشتری نسبت به سایر مدلهای استاندارد متن به ویدیو میدهد. Moonvalley مدل خود را تحت عنوان Marey در ماه مارس بهصورت آزمایشی راهاندازی کرد و اکنون آن را بهصورت اشتراک ماهانه با اعتبارهای مشخص ارائه میدهد. کاربران میتوانند با پرداخت 14.99 دلار، 100 اعتبار، با 34.99 دلار، 250 اعتبار و با 149.99 دلار، 1,000 اعتبار خریداری کنند. قابلیت تولید کلیپهای تا پنج ثانیهای موافق با استانداردهای صنعتی در زمینه تولید ویدیوهای عمومی، از دیگر ویژگیهای این محصول است.
این استارتاپ که توسط پژوهشگران سابق DeepMind که بر روی مدل تولید ویدیوی گوگل کار کردهاند، تأسیس شده، ادعا میکند که Marey یکی از معدود مدلهایی است که بهطور کامل بر اساس دادههای آزاد و مجوزدار آموزش دیده است. این موضوع بهخوبی با مشتریان هدف Moonvalley، یعنی فیلمسازانی که میخواهند از دعاوی آینده بر سر محتوای تولید شده با هوش مصنوعی که ممکن است شبیه مواد دارای حق نشر باشد، اجتناب کنند، همخوانی دارد. برای فیلمساز مستقل، آنخل مانوئل سوتو، مهمترین نقطه قوت Marey این است که دسترسی به ابزارهای برتر داستانگویی با هوش مصنوعی را دموکراتیک میکند، بهویژه برای افرادی که همیشه احساس کردهاند از فیلمسازی سنتی کنار گذاشته شدهاند.
سوتو در این باره میگوید: «در پورتوریکو، شما ابتدا باید صدها یا هزاران دلار جمعآوری کنید فقط برای اجاره دوربینها بهمنظور ساخت فیلم. در خانهام ما باید برای گفتن داستانهایمان از دیگران اجازه میگرفتیم.» او ادامه میدهد: «هوش مصنوعی به شما این امکان را میدهد که این کار را با شرایط خودتان انجام دهید، بدون اینکه به خاطر عدم تأمین مالی، مجبور به از دست دادن رویاهایتان شوید.» اکنون، سوتو میگوید که Marey به او کمک کرده تا هزینههای تولید را بین 20 تا 40 درصد کاهش دهد و آزادی بیشتری در کار خود داشته باشد.
مدیرعامل و بنیانگذار Moonvalley، نعیم تلوکدار، در یک نمایش برای TechCrunch، چگونگی استفاده از Marey در مراحل پیشتولید و پستولید را نشان داد. او توضیح داد که چگونه این مدل میتواند برای آزمایش صحنهها قبل از فیلمبرداری یا تنظیم زوایای دوربین پس از آن استفاده شود و همچنین توانایی کنترل اشیاء، شخصیتها، حرکات و ترکیب صحنه را دارد. تلوکدار همچنین اشاره کرد که Marey دارای درکی از دنیای فیزیکی است که میتواند به داستانگویی تعاملیتر کمک کند.
در حال حاضر، این نوع درک — که Marey با مدلهای دیگری مانند Veo 3 گوگل و Sora هنوز خصوصی OpenAI به اشتراک میگذارد — به Marey این اجازه را میدهد که حرکاتی را تقلید کند که همچنان با قوانین فیزیک در تناقض نباشد. به عنوان مثال، ویدیوی یک بایسون که در حال دویدن در دشتهاست، میتواند به یک کادیلاک که از همان محیط عبور میکند، ترجمه شود، در حالی که چمن و خاک به حرکات خودرو واکنش نشان میدهد. یا اینکه Marey میتواند شخصیتی شبیه به جورج واشنگتن را بر روی یک بازیگر نمایش دهد و هر چیزی از حرکات چهره بازیگر تا عضلات ساعد او را هنگام حرکت نشان دهد.
قابلیت جابجایی دوربین بهصورت آزاد، از جوانب منحصر به فرد Marey است که به کاربران اجازه میدهد تا با استفاده از ماوس، مسیر دوربین را تغییر دهند. تلوکدار نشان داد که چگونه این امکان را برای ویدیویی از زنی در قطار در راکیها فعال کرد، بهسادگی با کشیدن نشانگر موس. او اضافه کرد که Marey میتواند بهراحتی حرکات دوربین نزدیک به 360 درجه را نیز انجام دهد و به دستورات برای ایجاد تصاویری مانند فیلمبرداری با دوربین دستی یا دوچرخهسواری پایبند باشد.
Marey همچنین میتواند پسزمینه ویدیوها را تغییر دهد و به فیلمسازان اجازه میدهد تا با استفاده از تصاویر منبع، صحنه مورد نظر خود را بسازند. تلوکدار ویدیویی از یک مرد در حال موتورسواری در یک جاده حومهای را به نمایش گذاشت که سپس به مردی که بدون کلاه ایمنی، روی موتوری متفاوت در بزرگراهی روستایی در حال حرکت بود، تغییر کرد.
برنامه Moonvalley در چندماه آینده، ارائه کنترلهای جدید مانند روشنایی، مسیرهای عمیق اشیاء و کتابخانههای شخصیتها خواهد بود. این انتشار عمومی، Marey را در رقابت مستقیم با یک گروه رو به رشد از تولیدکنندگان ویدیو با هوش مصنوعی قرار میدهد – مدلهایی مانند Runway Gen-3، Luma Dream Machine، Pika و Haiper.