دعوت به کانال تلگرام
کانال بینا ویرا مرجع تخصصی اخبار هوش مصنوعی و تصاویر تولید شده با AI
عضویت در کانال

انویدیا مدل دید-زبانی عمل‌محور Alpamayo-R1 را برای تحقیق در خودران‌ها معرفی کرد

انویدیا روز دوشنبه در جریان کنفرانس NeurIPS در سن دیه‌گو از مجموعه‌ای از زیرساخت‌ها و مدل‌های هوش مصنوعی جدید رونمایی کرد که هدف آن ساخت فناوری پایه برای «هوش مصنوعی فیزیکی» است؛ حوزه‌ای که شامل ربات‌ها و وسایل نقلیه خودران می‌شود و بر درک و تعامل ماشین‌ها با دنیای واقعی تمرکز دارد. مهم‌ترین معرفی این شرکت مدل Alpamayo-R1 است؛ یک مدل دید-زبان (vision-language action model) متن‌باز که به‌طور خاص برای تحقیقات در حوزه رانندگی خودران طراحی شده است و به گفته انویدیا، نخستین مدل از این نوع متمرکز بر خودران‌ها محسوب می‌شود.

مدل‌های دید-زبان توانایی پردازش هم‌زمان تصویر و متن را دارند و به خودروها امکان می‌دهند محیط پیرامون را «ببینند» و بر اساس ادراک خود تصمیم‌گیری کنند. Alpamayo-R1 بر پایه مدل استدلالی انویدیا به نام Cosmos-Reason توسعه یافته است؛ مدلی که قبل از پاسخ‌دهی، فرایندهای استدلالی را برای تصمیم‌گیری دنبال می‌کند. خانواده مدل‌های Cosmos نخستین‌بار در ژانویه 2025 معرفی شد و نسخه‌های تکمیلی در ماه‌های بعد منتشر گردید.

اهمیت فناوری‌هایی مانند Alpamayo-R1 برای رسیدن به سطح 4 خودران (Full Autonomy در محدوده و شرایط تعریف‌شده) حیاتی است؛ چرا که سطح 4 مستلزم توانایی تصمیم‌گیری پیچیده و درک شرایط متغیر ترافیکی است که شبیه «حس‌ و عقل سلیم» انسانی عمل کند. انویدیا امیدوار است مدل‌های استدلالی بتوانند به خودروهای خودران در مواجهه با تصمیمات رانندگی ظریف و موقعیت‌های نامعلوم کمک کنند.

دسترس‌پذیری و ابزارهای توسعه
Alpamayo-R1 به‌صورت متن‌باز در GitHub و Hugging Face در دسترس قرار گرفته است. به‌علاوه، انویدیا مجموعه‌ای از راهنماها، منابع استنتاج و گردش‌کارهای پس از آموزش را تحت عنوان «Cosmos Cookbook» در GitHub منتشر کرده است. این راهنماها به توسعه‌دهندگان کمک می‌کند تا مدل‌های Cosmos را برای موارد کاربردی خاص خود بهینه کنند و شامل موضوعاتی مانند:
– گردآوری و پاک‌سازی داده‌ها (data curation)
– تولید داده‌های مصنوعی برای افزایش پوشش موقعیت‌ها (synthetic data generation)
– ارزیابی و اعتبارسنجی مدل‌ها (model evaluation)
این ابزارها می‌توانند سرعت تحقیقات و توسعه در حوزه خودران را افزایش داده و امکان آزمون سناریوهای نادر یا خطرناک را در محیط‌های شبیه‌سازی‌شده فراهم سازند.

استراتژی انویدیا در هوش مصنوعی فیزیکی
این اعلامیه‌ها در زمانی منتشر می‌شود که انویدیا با تمرکز بر هوش مصنوعی فیزیکی، تلاش می‌کند جایگاه خود را فراتر از پردازنده‌های گرافیکی معمول تقویت کند. جنسن هوانگ، مدیرعامل و یکی از بنیان‌گذاران انویدیا، بارها موج بعدی هوش مصنوعی را هوش مصنوعی فیزیکی توصیف کرده است و بیل دالی، دانشمند ارشد این شرکت، نیز بر اهمیت رباتیک و نقش انویدیا در «توسعه مغز ربات‌ها» تأکید دارد. به گفته دالی، برای حضور مؤثر در دنیای ربات‌ها باید از اکنون روی فناوری‌های کلیدی تمرکز کرد.

جمع‌بندی
معرفی Alpamayo-R1 و انتشار ابزارهای مربوط به Cosmos نشان‌دهنده گام مهمی در جهت کاربردی‌تر شدن مدل‌های دید-زبان در حوزه خودران است. در کوتاه‌مدت این اقدامات به تسهیل تحقیقات و توسعه کمک می‌کند و در بلندمدت می‌تواند یکی از اجزای کلیدی برای محقق کردن هدف سطح 4 خودران و حضور گسترده‌تر هوش مصنوعی در رباتیک و وسایل نقلیه خودمختار باشد.

تجزیه و تحلیل تصویر با هوش مصنوعی

دیدگاه‌ خود را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

اسکرول به بالا