مدل جدید هوش مصنوعی اودیسه: پخش جهان‌های سه‌بعدی تعاملی

استارتاپ «اودیسه»، که توسط پیشگامان اتومبیل‌های خودران، «الیور کامرون» و «جف هاوک» تأسیس شده است، مدلی هوش مصنوعی را توسعه داده که به کاربران این امکان را می‌دهد تا با ویدیوهای استریم‌شده به‌صورت تعاملی ارتباط برقرار کنند. این مدل در یک دمو اولیه به‌صورت آنلاین در دسترس قرار دارد و ویدیو فریم‌ها را هر ۴۰ میلی‌ثانیه تولید و استریم می‌کند. با استفاده از کنترل‌های ساده، بینندگان می‌توانند درون ویدیوها کاوش کنند، مشابه با یک بازی ویدیویی سه‌بعدی. شرکت اودیسه در یک پست وبلاگ توضیح می‌دهد: “با توجه به وضعیت فعلی جهان، یک عمل ورودی، و تاریخچه‌ای از وضعیت‌ها و اعمال، این مدل تلاش می‌کند تا وضعیت بعدی جهان را پیش‌بینی کند.”

این فناوری به‌وسیله یک مدل جدید دنیای واقعی به کار می‌افتد که قابلیت‌هایی از جمله تولید پیکسل‌هایی با احساس واقع‌گرایانه، حفظ تداوم فضایی، یادگیری اعمال از ویدیو و تولید جریان‌های ویدیویی همساز به مدت ۵ دقیقه یا بیشتر را نشان می‌دهد. «ویدیوهای تعاملی» که می‌توانید به‌صورت زنده تماشا و با آن‌ها در تعامل باشید، به‌طور رایگان در دسترس همگان قرار دارد (بسته به قابلیت‌های پردازش گرافیکی).

تعدادی از استارتاپ‌ها و شرکت‌های بزرگ فناوری در حال تحقیق و توسعه مدل‌های دنیای واقعی هستند، از جمله «دیپ‌مایند»، «لِی فِی فی»، «مایکروسافت» و «دیکارت». این شرکت‌ها عقیده دارند که این مدل‌ها می‌توانند روزی برای تولید رسانه‌های تعاملی، مانند بازی‌ها و فیلم‌ها، و همچنین شبیه‌سازی‌های واقعی مانند محیط‌های آموزشی برای روبات‌ها مورد استفاده قرار بگیرند. با این حال، نظر خلاقان در مورد این فناوری متفاوت است. یک تحقیق اخیر از طرف «وایرد» نشان داد که استودیوهای بازی از جمله «اکتیویژن بلزارد»، که با تعدادی از کارکنان خود قطع همکاری کرده، از هوش مصنوعی برای کاهش هزینه‌ها و مقابله با کاهش نیروی انسانی استفاده می‌کنند.

به نوبه خود، اودیسه متعهد به همکاری با حرفه‌ای‌های خلاق است و نه جایگزینی آن‌ها. این شرکت در وبلاگ خود می‌نویسد: “ویدیوهای تعاملی… درهای جدیدی به روی اشکال کاملاً جدیدی از سرگرمی می‌گشاید، جایی که داستان‌ها می‌توانند به‌طور نامحدود تولید و کاوش شوند، بدون محدودیت‌ها و هزینه‌های تولید سنتی.”

دموی اودیسه تا حدودی خام و ناپایدار به نظر می‌رسد و شرکت خود به این موضوع اعتراف کرده است. محیط‌هایی که مدل تولید می‌کند، مبهم و دچار اعوجاج هستند و ساختارهایشان همیشه ثابت نمی‌ماند. به‌عنوان مثال، اگر در یک جهت حرکت کنید یا بچرخید، ممکن است اطراف ناگهان متفاوت به نظر برسد. با این حال، این شرکت وعده داده که به‌سرعت بر روی این مدل بهبودهایی اعمال کند که در حال حاضر قادر است ویدیو را با نرخ ۳۰ فریم در ثانیه از خوشه‌های پردازشگر گرافیکی Nvidia H100 استریم کند، با هزینه‌ای در حدود ۱ تا ۲ دلار به ازای هر «ساعت کاربر».

به‌علاوه، اودیسه در حال تحقیق بر روی بازنمایی‌های دنیای واقعی است که دینامیک‌ها را به‌طور دقیق تری نمایش دهند و ثبات زمانی و وضعیت پایدار را افزایش دهند. این شرکت همچنین در حال گسترش فضای عملکرد خود از حرکت به تعامل با دنیا است و در حال یادگیری عملکردهای باز از ویدیوهای بزرگ‌مقیاس است.

اودیسه دیکته‌های متفاوتی از دیگر آزمایشگاه‌های هوش مصنوعی در زمینه مدل‌سازی دنیا اتخاذ کرده است که یکی از آن‌ها طراحی یک سیستم دوربین ۳۶۰ درجه و قابل حمل است تا مناظر دنیای واقعی را ضبط کند، که اودیسه بر این باور است می‌تواند به‌عنوان پایه‌ای برای مدل‌های با کیفیت بالاتر عمل کند. تا به امروز، این استارتاپ موفق به جذب ۲۷ میلیون دلار از سرمایه‌گذاران از جمله «EQT Ventures»، «GV» و «Air Street Capital» شده است. ایڈ کتمول، یکی از بنیانگذاران پیکسار و رییس سابق استودیو انیمیشن والت دیزنی، در هیئت مدیره این استارتاپ قرار دارد. در دسامبر گذشته، اودیسه اعلام کرد که در حال تولید نرم‌افزاری است که به خالقان اجازه می‌دهد صحنه‌های ایجادشده توسط مدل‌های خود را به ابزارهایی مانند Unreal Engine، Blender و Adobe After Effects بارگذاری تا ویرایش دستی انجام دهند.

تولید تصویر با هوش مصنوعی

مدل جدید هوش مصنوعی اودیسه: پخش جهان‌های سه‌بعدی تعاملی

دیدگاه‌ خود را بنویسید لغو پاسخ