Runway مدل جهانی جدید خود را با نام GWM‑1 رونمایی کرد؛ شبیه‌سازی مبتنی بر پیش‌بینی فریم‌به‌فریم

شرکت فعال در زمینه تولید تصویر و ویدیو با هوش مصنوعی، Runway، از اولین «مدل جهانی» خود با نام GWM‑1 رونمایی کرد. این مدل با روش پیش‌بینی فریم‌به‌فریم ساخته شده و هدف آن ایجاد شبیه‌سازی‌هایی است که رفتار فیزیکی و تغییرات جهان را در طول زمان درک و بازتولید کند. به‌عبارت دیگر، GWM‑1 تلاش می‌کند یک «مدل درونی» از جهان بسازد تا بتواند بدون نیاز به آموزش برای هر سناریوی ممکن، استدلال، برنامه‌ریزی و اقدام کند.

مدل جهانی چیست و چرا اهمیت دارد؟
مدل‌های جهانی (world models) سامانه‌هایی هستند که با یادگیری یک شبیه‌سازی داخلی از قوانین فیزیکی، هندسه و دینامیک محیط، قابلیت پیش‌بینی نتایج اعمال مختلف را پیدا می‌کنند. این قابلیت برای توسعه رباتیک، تحقیقات علوم زیستی، آموزش عامل‌ها (agents) و تولید محتوای تعاملی حیاتی است، زیرا به جای جمع‌آوری داده‌های واقعی و گران‌قیمت برای هر حالت ممکن، می‌توان از شبیه‌سازی‌های مقیاس‌پذیر استفاده کرد.

رویکرد Runway: پیش‌بینی پیکسل‌ها و اتکا به مدل ویدیو
Runway می‌گوید برای ساخت GWM‑1 ابتدا بر توسعه یک مدل ویدیویی برجسته تمرکز کرده است. به گفته آناستاسیس جرمانیدیس، مدیر فنی شرکت، «راه درست برای ساخت مدل جهانی، آموزش مدل‌ها به پیش‌بینی مستقیم پیکسل‌ها است.» به‌عبارت دیگر، با مقیاس و داده مناسب، پیش‌بینی فریم‌ها می‌تواند به درک عمومی‌تری از چگونگی کارکرد جهان منجر شود. پیش از این، Runway همین ماه مدل ویدیویی Gen 4.5 را منتشر کرده بود که در لیدربورد Video Arena از رقبایی مانند گوگل و OpenAI جلوتر رفته بود؛ حالا GWM‑1 را به‌عنوان گام بعدی معرفی کرده است.

نسخه‌ها و کاربردهای متفاوت: Worlds، Robotics و Avatars
Runway سه شاخه یا «زاویه» متفاوت از GWM‑1 ارائه کرده است:
– GWM‑Worlds: اپلیکیشنی برای ساخت پروژه‌های تعاملی؛ کاربر می‌تواند صحنه‌ای را با پرامپت یا تصویر مرجع تعیین کند و مدل با درک هندسه، فیزیک و نورپردازی، دنیای پیرامون را تولید می‌کند. شرکت اعلام کرده شبیه‌سازی‌ها با نرخ 24 فریم بر ثانیه و وضوح 720p اجرا می‌شوند. Worlds علاوه بر کاربردهای گیمینگ، مناسب آموزش عامل‌ها برای ناوبری و تعامل در جهان فیزیکی نیز توصیف شده است.
– GWM‑Robotics: هدف تولید داده‌های سنتتیک غنی‌شده با پارامترهای متغیر مانند تغییرات آب‌وه‌هوایی یا موانع است تا ربات‌ها در شرایط متنوع آموزش ببینند. این روش می‌تواند نشان دهد چه زمانی و چگونه ربات‌ها ممکن است دستورالعمل‌ها یا سیاست‌ها را نقض کنند که برای ارزیابی ایمنی و رعایت قواعد اهمیت دارد.
– GWM‑Avatars: شبیه‌سازی رفتار انسانی و ساخت آواتارهای واقع‌گرایانه برای کاربردهایی مانند ارتباطات، آموزش و تعامل. حوزه‌ای که شرکت‌هایی مانند D‑ID، Synthesia و Soul Machines نیز در آن فعالیت دارند.

ادغام آینده و دسترسی تجاری
Runway تأکید کرده که فعلاً Worlds، Robotics و Avatars به‌صورت مدل‌های جدا عمل می‌کنند اما برنامه‌ریزی برای ادغام آن‌ها در یک مدل واحد در آینده وجود دارد. به‌علاوه، شرکت نسخه به‌روزشده Gen 4.5 را نیز با قابلیت‌های بومی صوتی و تولید بلندمدت چندشات منتشر کرده که امکان خلق ویدیوهای یک‌دقیقه‌ای با انسجام شخصیت، دیالوگ بومی، صداهای پس‌زمینه و شات‌های پیچیده را فراهم می‌کند. این آپدیت برای کاربران پلن‌های پولی در دسترس است و GWM‑Robotics قرار است از طریق یک SDK در دسترس توسعه‌دهندگان قرار گیرد. شرکت اعلام کرده در حال گفت‌وگو با چند شرکت رباتیک و سازمان‌ها برای کاربردهای تجاری GWM‑Robotics و GWM‑Avatars است.

پیامدها و چالش‌ها
معرفی GWM‑1 نشان‌دهنده رقابت فزاینده میان استارتاپ‌ها و بازیگران بزرگ فناوری برای عرضه مدل‌های جهانی است. این فناوری می‌تواند توسعه رباتیک، شبیه‌سازی‌های آموزشی و تولید محتوای تعاملی را تسریع کند، اما هم‌زمان نیازمند توجه جدی به مسائل ایمنی، تعمیم‌پذیری مدل‌ها و پاسخگویی در برابر رفتارهای غیرمنتظره آژنت‌ها است. در کوتاه‌مدت Runway با ارائه SDK و دسترسی تجاری، مسیر پیاده‌سازی کاربردی مدل‌های جهانی را هموار می‌کند و رقابت در این حوزه را وارد فاز عملیاتی‌تر می‌سازد.

تبدیل گفتار به نوشتار فارسی

دیدگاه‌ خود را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

اسکرول به بالا