استارتاپ «اودیسه»، که توسط پیشگامان اتومبیلهای خودران، «الیور کامرون» و «جف هاوک» تأسیس شده است، مدلی هوش مصنوعی را توسعه داده که به کاربران این امکان را میدهد تا با ویدیوهای استریمشده بهصورت تعاملی ارتباط برقرار کنند. این مدل در یک دمو اولیه بهصورت آنلاین در دسترس قرار دارد و ویدیو فریمها را هر ۴۰ میلیثانیه تولید و استریم میکند. با استفاده از کنترلهای ساده، بینندگان میتوانند درون ویدیوها کاوش کنند، مشابه با یک بازی ویدیویی سهبعدی. شرکت اودیسه در یک پست وبلاگ توضیح میدهد: “با توجه به وضعیت فعلی جهان، یک عمل ورودی، و تاریخچهای از وضعیتها و اعمال، این مدل تلاش میکند تا وضعیت بعدی جهان را پیشبینی کند.”
این فناوری بهوسیله یک مدل جدید دنیای واقعی به کار میافتد که قابلیتهایی از جمله تولید پیکسلهایی با احساس واقعگرایانه، حفظ تداوم فضایی، یادگیری اعمال از ویدیو و تولید جریانهای ویدیویی همساز به مدت ۵ دقیقه یا بیشتر را نشان میدهد. «ویدیوهای تعاملی» که میتوانید بهصورت زنده تماشا و با آنها در تعامل باشید، بهطور رایگان در دسترس همگان قرار دارد (بسته به قابلیتهای پردازش گرافیکی).
تعدادی از استارتاپها و شرکتهای بزرگ فناوری در حال تحقیق و توسعه مدلهای دنیای واقعی هستند، از جمله «دیپمایند»، «لِی فِی فی»، «مایکروسافت» و «دیکارت». این شرکتها عقیده دارند که این مدلها میتوانند روزی برای تولید رسانههای تعاملی، مانند بازیها و فیلمها، و همچنین شبیهسازیهای واقعی مانند محیطهای آموزشی برای روباتها مورد استفاده قرار بگیرند. با این حال، نظر خلاقان در مورد این فناوری متفاوت است. یک تحقیق اخیر از طرف «وایرد» نشان داد که استودیوهای بازی از جمله «اکتیویژن بلزارد»، که با تعدادی از کارکنان خود قطع همکاری کرده، از هوش مصنوعی برای کاهش هزینهها و مقابله با کاهش نیروی انسانی استفاده میکنند.
به نوبه خود، اودیسه متعهد به همکاری با حرفهایهای خلاق است و نه جایگزینی آنها. این شرکت در وبلاگ خود مینویسد: “ویدیوهای تعاملی… درهای جدیدی به روی اشکال کاملاً جدیدی از سرگرمی میگشاید، جایی که داستانها میتوانند بهطور نامحدود تولید و کاوش شوند، بدون محدودیتها و هزینههای تولید سنتی.”
دموی اودیسه تا حدودی خام و ناپایدار به نظر میرسد و شرکت خود به این موضوع اعتراف کرده است. محیطهایی که مدل تولید میکند، مبهم و دچار اعوجاج هستند و ساختارهایشان همیشه ثابت نمیماند. بهعنوان مثال، اگر در یک جهت حرکت کنید یا بچرخید، ممکن است اطراف ناگهان متفاوت به نظر برسد. با این حال، این شرکت وعده داده که بهسرعت بر روی این مدل بهبودهایی اعمال کند که در حال حاضر قادر است ویدیو را با نرخ ۳۰ فریم در ثانیه از خوشههای پردازشگر گرافیکی Nvidia H100 استریم کند، با هزینهای در حدود ۱ تا ۲ دلار به ازای هر «ساعت کاربر».
بهعلاوه، اودیسه در حال تحقیق بر روی بازنماییهای دنیای واقعی است که دینامیکها را بهطور دقیق تری نمایش دهند و ثبات زمانی و وضعیت پایدار را افزایش دهند. این شرکت همچنین در حال گسترش فضای عملکرد خود از حرکت به تعامل با دنیا است و در حال یادگیری عملکردهای باز از ویدیوهای بزرگمقیاس است.
اودیسه دیکتههای متفاوتی از دیگر آزمایشگاههای هوش مصنوعی در زمینه مدلسازی دنیا اتخاذ کرده است که یکی از آنها طراحی یک سیستم دوربین ۳۶۰ درجه و قابل حمل است تا مناظر دنیای واقعی را ضبط کند، که اودیسه بر این باور است میتواند بهعنوان پایهای برای مدلهای با کیفیت بالاتر عمل کند. تا به امروز، این استارتاپ موفق به جذب ۲۷ میلیون دلار از سرمایهگذاران از جمله «EQT Ventures»، «GV» و «Air Street Capital» شده است. ایڈ کتمول، یکی از بنیانگذاران پیکسار و رییس سابق استودیو انیمیشن والت دیزنی، در هیئت مدیره این استارتاپ قرار دارد. در دسامبر گذشته، اودیسه اعلام کرد که در حال تولید نرمافزاری است که به خالقان اجازه میدهد صحنههای ایجادشده توسط مدلهای خود را به ابزارهایی مانند Unreal Engine، Blender و Adobe After Effects بارگذاری تا ویرایش دستی انجام دهند.