پیشنهادات جدید دمیس هاسابیس درباره مدل ویدیوساز Veo 3 و کاربرد آن در گیمینگ
دمیس هاسابیس، مدیرعامل سازمان تحقیقاتی هوش مصنوعی گوگل، دیپمایند، در روز سهشنبه به طور ضمنی اشاره کرد که ممکن است مدل ویدیوساز جدید گوگل، Veo 3، قابلیتهای جالبی برای بازیهای ویدئویی داشته باشد. در پاسخ به یک پست در شبکه اجتماعی X که از گوگل درخواست کرده بود تا اجازه دهد یک بازی ویدئویی را با ویدیوهای Veo 3 خود تجربه کند، هاسابیس به طور غیرمستقیم اعلام کرد: «خب، این موضوع جالبی خواهد بود.»
در صبح روز چهارشنبه، لوگان کیلباتریک، مدیر محصول استودیو هوش مصنوعی گوگل و API جمنی، با واکنشی جالب به این موضوع پاسخ داد: «🤐🤐🤐🤐» این پستها بیشتر شبیه به پیشنهادات سرگرمکننده هستند و یک سخنگوی گوگل به رسانه TechCrunch اعلام کرد که در حال حاضر اطلاعات بیشتری برای ارائه وجود ندارد. با این حال، توسعه مدلهای جهانی قابل بازی برای این غول فناوری دور از ذهن نیست.
مدلهای جهانی با مدلهای تولید ویدیو تفاوت دارند. اولین مورد دینامیکهای یک محیط واقعی را شبیهسازی میکند و به عاملان این امکان را میدهد تا پیشبینی کنند جهان چگونه در پاسخ به اقداماتشان تکامل خواهد یافت. از سوی دیگر، مدلهای تولید ویدیو به سنتز توالیهای ویدیویی واقعی میپردازند. گوگل در نظر دارد مدل پایه چندرسانهای خود، جمنی 2.5 پرو، را به یک مدل جهانی تبدیل کند که جنبههای مغز انسان را شبیهسازی کند. در دسامبر، دیپمایند مدل Genie 2 را معرفی کرد که میتواند تنوع «نامحدودی» از دنیاهای قابل بازی ایجاد کند. در ماه بعد، گزارش دادیم که گوگل در حال تشکیل تیمی جدید برای کار بر روی مدلهای هوش مصنوعی است که میتوانند واقعیت را شبیهسازی کنند.
دیگر پژوهشگران نیز در حال ساخت مدلهای جهانی هستند، از جمله فیفی لی، پیشگام هوش مصنوعی که سال گذشته با استارتاپ World Labs که سیستم هوش مصنوعی خود را برای تولید صحنههای سهبعدی مانند بازیها بر اساس یک تصویر معرفی کرد، به عرصه آمد. Veo 3، که هنوز در مرحله پیشنمایش عمومی قرار دارد، قادر به ایجاد ویدیو و صدا به همراه کلیپها است — از سخنرانیها گرفته تا موسیقی متن. در حالی که Veo 3 حرکات واقعی را با شبیهسازی فیزیک واقعی تولید میکند، هنوز به مدل جهانی تبدیل نشده است. به جای آن، میتوان از آن برای روایت داستانهای سینمایی در بازیها، مانند کاتسینها، تریلرها و پروتوتایپهای داستانی استفاده کرد.
این مدل همچنین هنوز یک مدل تولیدی «خنثی» است و برای تحول به یک شبیهساز فعال، تعاملی و پیشبینیکننده نیاز به تغییرات دارد. اما چالش اصلی در تولید بازیهای ویدئویی فقط به تصاویر جذاب محدود نمیشود؛ بلکه شامل شبیهسازی زمان واقعی، مداوم و قابل کنترل نیز میباشد. به همین دلیل ممکن است گوگل رویکرد ترکیبی را برای استفاده از Veo و Genie در آینده در پیش بگیرد. این نکته به خصوص در نگرانی از رقابت با دیگر مجموعهها مانند مایکروسافت، سناریو، رانوی و به زودی مدل ویدیواساز OpenAI یعنی Sora، حائز اهمیت است. با توجه به برنامههای گوگل در زمینه مدلهای جهانی و اعتباری که این شرکت برای تسلط بر رقبای خود دارد، رقبا در این حوزه باید به دقت اوضاع را پیگیری کنند.