General Intuition؛ لابراتواری تازهتأسیس که از دل پلتفرم Medal متولد شد
General Intuition، پژوهشگاه تازهتأسیس در حوزه هوش مصنوعی فضازمانمحور، از دل پلتفرم آپلود و اشتراکگذاری کلیپهای بازیهای ویدیویی Medal بیرون آمد. این استارتاپ از مجموعه داده عظیمی که Medal در اختیار دارد برای آموزش مدلهای پایه و عاملهای هوش مصنوعی استفاده میکند تا توانایی درک حرکت اشیاء و موجودات در فضا و زمان — آنچه به آن «استدلال فضازمانی» میگویند — را توسعه دهد. Medal سالانه حدود 2 میلیارد ویدیو ویدئویی تولید میکند و بیش از 10 میلیون کاربر فعال ماهانه از دهها هزار بازی مختلف کلیپ بارگذاری میکنند؛ مجموعه دادهای که به گفته بنیانگذاران برای آموزش عاملها از منابعی مثل Twitch یا YouTube برتری دارد.
دادههای بازی؛ مزیتی نادر برای آموزش عاملها
Pim de Witte، مدیرعامل Medal و General Intuition، توضیح میدهد که هنگام بازی، بازیکن معمولاً دید اولشخص خود را به محیطهای مجازی منتقل میکند و همین دید اولشخص و تنوع موقعیتها، اطلاعات بصری ارزشمندی برای یادگیری حرکت و تصمیمگیری فراهم میآورد. علاوه بر این، کاربران اغلب کلیپهایی که یا بسیار موفق یا بسیار ناموفق هستند بارگذاری میکنند — یعنی نمونههای لبهای (edge cases) که برای آموزش مدلها بسیار مفیدند. این «سوگیری انتخابی» در دادهها بهصورت طبیعی مجموعهای از حالات آموزشی مطلوب تولید میکند که میتواند کیفیت آموزش را افزایش دهد.
پشتیبانی مالی و توجه بازار
گفته میشود توجه شرکتهایی مانند OpenAI نیز به این مجموعه داده جلب شده و طبق گزارش The Information، OpenAI اواخر سال گذشته برای خرید Medal پیشنهادی 500 میلیون دلاری ارائه کرده است؛ هرچند OpenAI و General Intuition در این باره اظهار نظر نکردهاند. General Intuition در دور بذر (seed) موفق به جذب سرمایهای معادل 133.7 میلیون دلار شد؛ رهبری این دور سرمایهگذاری بر عهده Khosla Ventures و General Catalyst بوده و Raine نیز مشارکت داشته است. این سرمایه برای توسعه تیم پژوهشی و مهندسی و پیشبرد هدف ساخت یک عامل عمومی که قادر به تعامل با دنیای پیرامون باشد اختصاص خواهد یافت.
چگونه مدلها آموزش میبینند؛ دید بصری و ورودیهای کنترلر
یکی از نکات برجسته فناوری General Intuition این است که عاملها تنها از ورودیهای بصری که یک بازیکن انسانی میبیند آموزش میبینند و برای حرکت در محیطها از همان ورودیهای کنترلری استفاده میکنند که انسانها به کار میبرند. بنیانگذاران میگویند مدلهای اولیه این تیم میتوانند محیطهایی را که صرفاً روی آنها آموزش ندیدهاند درک کنند و عملهایی را در آنها بهدرستی پیشبینی کنند. این رویکرد دیداری-کنترلی امکان انتقال به سیستمهای فیزیکی مانند بازوهای رباتیک، پهپادها و وسایل نقلیه خودران را فراهم میسازد چرا که بسیاری از این سامانهها نیز توسط انسانها با ورودیهای مشابه هدایت میشوند.
کاربردها و مزیت رقابتی
General Intuition برنامهریزی کرده تا ابتدا در حوزههای بازیسازی و پهپادهای جستوجو و نجات کاربردی شود. در بازیها هدف ساخت رباتها و شخصیتهای غیرقابلبازی (NPC) است که فراتر از روباتهای تعیینشده و پیشبرنامهریزی شده عمل کنند و بتوانند سطح دشواری را بهطور پویا تنظیم کنند تا تجربه کاربر جذابتر و نرخ نگهداری (retention) افزایش یابد. برخلاف بعضی رقبا که مدلهای جهان را بهعنوان محصول میفروشند، General Intuition میگوید تمرکز اصلیاش روی کاربردهای دیگری است تا از مشکلات حقوقی و موارد مربوط به کپیرایت دوری کند.
اهداف فنی بعدی و چشمانداز AGI
دو هدف فنی بعدی شرکت شامل توانایی تولید جهانهای شبیهسازیشده جدید برای آموزش عاملها و حرکت مستقل در محیطهای فیزیکی کاملاً ناآشنا است. بنیانگذاران معتقدند که استدلال فضازمانی یکی از قطعات کلیدی در مسیر رسیدن به هوش مصنوعی عمومی (AGI) است، زیرا مدلهای زبانی بزرگ (LLM) هرچند در پردازش متن قویاند، اطلاعات کلیدی درباره ساختار فیزیکی و روابط فضازمانی را از دست میدهند. به گفته Pim de Witte، «ما در توصیف متن بسیاری از اطلاعات دنیای واقعی را از دست میدهیم؛ استدلال فضازمانی بخشی است که مدلها را از درک صرفاً زبانی فراتر میبرد.»
جمعبندی
General Intuition با اتکا به مجموعه داده عظیم Medal و رویکردی مبتنی بر ورودیهای بصری اولشخص تلاش میکند عاملهایی بسازد که واقعیت فیزیکی و دینامیک حرکت را بهتر درک کنند. اگر این مسیر موفقیتآمیز باشد، میتواند کاربردهای متنوعی از بازیهای تعاملی تا رباتهای نجات و سامانههای خودران را متحول کند و نقش مهمی در توسعه مؤلفههای مورد نیاز برای AGI ایفا نماید.
