انویدیا مدل دید-زبانی عملمحور Alpamayo-R1 را برای تحقیق در خودرانها معرفی کرد
انویدیا روز دوشنبه در جریان کنفرانس NeurIPS در سن دیهگو از مجموعهای از زیرساختها و مدلهای هوش مصنوعی جدید رونمایی کرد که هدف آن ساخت فناوری پایه برای «هوش مصنوعی فیزیکی» است؛ حوزهای که شامل رباتها و وسایل نقلیه خودران میشود و بر درک و تعامل ماشینها با دنیای واقعی تمرکز دارد. مهمترین معرفی این شرکت مدل Alpamayo-R1 است؛ یک مدل دید-زبان (vision-language action model) متنباز که بهطور خاص برای تحقیقات در حوزه رانندگی خودران طراحی شده است و به گفته انویدیا، نخستین مدل از این نوع متمرکز بر خودرانها محسوب میشود.
مدلهای دید-زبان توانایی پردازش همزمان تصویر و متن را دارند و به خودروها امکان میدهند محیط پیرامون را «ببینند» و بر اساس ادراک خود تصمیمگیری کنند. Alpamayo-R1 بر پایه مدل استدلالی انویدیا به نام Cosmos-Reason توسعه یافته است؛ مدلی که قبل از پاسخدهی، فرایندهای استدلالی را برای تصمیمگیری دنبال میکند. خانواده مدلهای Cosmos نخستینبار در ژانویه 2025 معرفی شد و نسخههای تکمیلی در ماههای بعد منتشر گردید.
اهمیت فناوریهایی مانند Alpamayo-R1 برای رسیدن به سطح 4 خودران (Full Autonomy در محدوده و شرایط تعریفشده) حیاتی است؛ چرا که سطح 4 مستلزم توانایی تصمیمگیری پیچیده و درک شرایط متغیر ترافیکی است که شبیه «حس و عقل سلیم» انسانی عمل کند. انویدیا امیدوار است مدلهای استدلالی بتوانند به خودروهای خودران در مواجهه با تصمیمات رانندگی ظریف و موقعیتهای نامعلوم کمک کنند.
دسترسپذیری و ابزارهای توسعه
Alpamayo-R1 بهصورت متنباز در GitHub و Hugging Face در دسترس قرار گرفته است. بهعلاوه، انویدیا مجموعهای از راهنماها، منابع استنتاج و گردشکارهای پس از آموزش را تحت عنوان «Cosmos Cookbook» در GitHub منتشر کرده است. این راهنماها به توسعهدهندگان کمک میکند تا مدلهای Cosmos را برای موارد کاربردی خاص خود بهینه کنند و شامل موضوعاتی مانند:
– گردآوری و پاکسازی دادهها (data curation)
– تولید دادههای مصنوعی برای افزایش پوشش موقعیتها (synthetic data generation)
– ارزیابی و اعتبارسنجی مدلها (model evaluation)
این ابزارها میتوانند سرعت تحقیقات و توسعه در حوزه خودران را افزایش داده و امکان آزمون سناریوهای نادر یا خطرناک را در محیطهای شبیهسازیشده فراهم سازند.
استراتژی انویدیا در هوش مصنوعی فیزیکی
این اعلامیهها در زمانی منتشر میشود که انویدیا با تمرکز بر هوش مصنوعی فیزیکی، تلاش میکند جایگاه خود را فراتر از پردازندههای گرافیکی معمول تقویت کند. جنسن هوانگ، مدیرعامل و یکی از بنیانگذاران انویدیا، بارها موج بعدی هوش مصنوعی را هوش مصنوعی فیزیکی توصیف کرده است و بیل دالی، دانشمند ارشد این شرکت، نیز بر اهمیت رباتیک و نقش انویدیا در «توسعه مغز رباتها» تأکید دارد. به گفته دالی، برای حضور مؤثر در دنیای رباتها باید از اکنون روی فناوریهای کلیدی تمرکز کرد.
جمعبندی
معرفی Alpamayo-R1 و انتشار ابزارهای مربوط به Cosmos نشاندهنده گام مهمی در جهت کاربردیتر شدن مدلهای دید-زبان در حوزه خودران است. در کوتاهمدت این اقدامات به تسهیل تحقیقات و توسعه کمک میکند و در بلندمدت میتواند یکی از اجزای کلیدی برای محقق کردن هدف سطح 4 خودران و حضور گستردهتر هوش مصنوعی در رباتیک و وسایل نقلیه خودمختار باشد.
