آیا Veo 3 گوگل آغازگر مدل‌های دنیای قابل بازی است؟

پیشنهادات جدید دمیس هاسابیس درباره مدل ویدیوساز Veo 3 و کاربرد آن در گیمینگ

دمیس هاسابیس، مدیرعامل سازمان تحقیقاتی هوش مصنوعی گوگل، دیپ‌مایند، در روز سه‌شنبه به طور ضمنی اشاره کرد که ممکن است مدل ویدیوساز جدید گوگل، Veo 3، قابلیت‌های جالبی برای بازی‌های ویدئویی داشته باشد. در پاسخ به یک پست در شبکه اجتماعی X که از گوگل درخواست کرده بود تا اجازه دهد یک بازی ویدئویی را با ویدیوهای Veo 3 خود تجربه کند، هاسابیس به طور غیرمستقیم اعلام کرد: «خب، این موضوع جالبی خواهد بود.»

در صبح روز چهارشنبه، لوگان کیلباتریک، مدیر محصول استودیو هوش مصنوعی گوگل و API جمنی، با واکنشی جالب به این موضوع پاسخ داد: «🤐🤐🤐🤐» این پست‌ها بیشتر شبیه به پیشنهادات سرگرم‌کننده هستند و یک سخنگوی گوگل به رسانه TechCrunch اعلام کرد که در حال حاضر اطلاعات بیشتری برای ارائه وجود ندارد. با این حال، توسعه مدل‌های جهانی قابل بازی برای این غول فناوری دور از ذهن نیست.

مدل‌های جهانی با مدل‌های تولید ویدیو تفاوت دارند. اولین مورد دینامیک‌های یک محیط واقعی را شبیه‌سازی می‌کند و به عاملان این امکان را می‌دهد تا پیش‌بینی کنند جهان چگونه در پاسخ به اقداماتشان تکامل خواهد یافت. از سوی دیگر، مدل‌های تولید ویدیو به سنتز توالی‌های ویدیویی واقعی می‌پردازند. گوگل در نظر دارد مدل پایه چندرسانه‌ای خود، جمنی 2.5 پرو، را به یک مدل جهانی تبدیل کند که جنبه‌های مغز انسان را شبیه‌سازی کند. در دسامبر، دیپ‌مایند مدل Genie 2 را معرفی کرد که می‌تواند تنوع «نامحدودی» از دنیاهای قابل بازی ایجاد کند. در ماه بعد، گزارش دادیم که گوگل در حال تشکیل تیمی جدید برای کار بر روی مدل‌های هوش مصنوعی است که می‌توانند واقعیت را شبیه‌سازی کنند.

دیگر پژوهشگران نیز در حال ساخت مدل‌های جهانی هستند، از جمله فی‌فی لی، پیشگام هوش مصنوعی که سال گذشته با استارتاپ World Labs که سیستم هوش مصنوعی خود را برای تولید صحنه‌های سه‌بعدی مانند بازی‌ها بر اساس یک تصویر معرفی کرد، به عرصه آمد. Veo 3، که هنوز در مرحله پیش‌نمایش عمومی قرار دارد، قادر به ایجاد ویدیو و صدا به همراه کلیپ‌ها است — از سخنرانی‌ها گرفته تا موسیقی متن. در حالی که Veo 3 حرکات واقعی را با شبیه‌سازی فیزیک واقعی تولید می‌کند، هنوز به مدل جهانی تبدیل نشده است. به جای آن، می‌توان از آن برای روایت داستان‌های سینمایی در بازی‌ها، مانند کات‌سین‌ها، تریلرها و پروتوتایپ‌های داستانی استفاده کرد.

این مدل همچنین هنوز یک مدل تولیدی «خنثی» است و برای تحول به یک شبیه‌ساز فعال، تعاملی و پیش‌بینی‌کننده نیاز به تغییرات دارد. اما چالش اصلی در تولید بازی‌های ویدئویی فقط به تصاویر جذاب محدود نمی‌شود؛ بلکه شامل شبیه‌سازی زمان واقعی، مداوم و قابل کنترل نیز می‌باشد. به همین دلیل ممکن است گوگل رویکرد ترکیبی را برای استفاده از Veo و Genie در آینده در پیش بگیرد. این نکته به خصوص در نگرانی از رقابت با دیگر مجموعه‌ها مانند مایکروسافت، سناریو، ران‌وی و به زودی مدل ویدیواساز OpenAI یعنی Sora، حائز اهمیت است. با توجه به برنامه‌های گوگل در زمینه مدل‌های جهانی و اعتباری که این شرکت برای تسلط بر رقبای خود دارد، رقبا در این حوزه باید به دقت اوضاع را پیگیری کنند.

دستیار هوش مصنوعی

آیا Veo 3 گوگل آغازگر مدل‌های دنیای قابل بازی است؟

دیدگاه‌ خود را بنویسید لغو پاسخ