انویدیا شتاب توسعه رباتیک فیزیکی را با «مدلهای جهانی هوش مصنوعی» و شبیهسازیهای سریع افزایش میدهد
وقتی بیل دالی (Bill Dally) در سال 2009 مسئول آزمایشگاه تحقیقاتی انویدیا شد، تیمی کوچک حدود دوازدهنفره روی رندرینگ با روش ray tracing کار میکرد. امروز آن آزمایشگاه بیش از 400 پژوهشگر دارد و سهم قابلتوجهی در تبدیل انویدیا از یک استارتاپ پردازشگر گرافیکی بازیهای ویدیویی دهه نود به شرکت چندتریلیوندلاری که محرک موج اخیر هوش مصنوعی است، داشته است. اکنون این آزمایشگاه تحقیقاتی هدفگذاری خود را فراتر از GPU و مراکز داده هوش مصنوعی برده و روی فناوریهای کلیدی مورد نیاز برای رباتیک و هوش مصنوعی فیزیکی تمرکز میکند — فناوریهایی که بخشی از آن همین حالا در محصولات و ابزارهای توسعهدهندگان ظاهر شدهاند.
رشد هدفمند آزمایشگاه تحقیقاتی
دالی که پیش از پیوستن به انویدیا استاد و رئیس دپارتمان علوم کامپیوتر دانشگاه استنفورد بود، در ابتدا برای مرخصی علمی به انویدیا مشاوره میداد اما پس از تشویقهای مدیران وقت و جینسن هوانگ (Jensen Huang) به موقعیتی دائم پیوست. از سال 2009 به بعد، آزمایشگاه بهسرعت حوزههای جدیدی مانند طراحی مدار و VLSI را به فهرست پژوهشهای خود افزود و بهتدریج وارد توسعه سختافزار و نرمافزار ویژه هوش مصنوعی شد. انویدیا خیلی زود، از حوالی 2010، بهسرمایهگذاری روی GPUهای تخصصی برای هوش مصنوعی پرداخت و نرمافزارهای پشتیبان را توسعه داد — تصمیمی که بعدها به مزیت استراتژیک این شرکت در بازار AI تبدیل شد.
جهش به رباتیک فیزیکی و «مغزِ رباتها»
با تسلط بازار GPUهای هوش مصنوعی، انویدیا به دنبال بازارهای جدید بیرون از دیتاسنترها رفت؛ یکی از این عرصهها رباتیک فیزیکی است. دالی صریح میگوید هدف این است که «مغزِ تمام رباتها را بسازند» و برای رسیدن به این هدف باید فناوریهای پایهای شبیهسازی، بازسازی سهبعدی و مدلسازی جهان را توسعه دهند.
فناوریهای کلیدی: Omniverse، رندر تفاضلی و مدلهای جهان
سانجا فیدلر (Sanja Fidler)، معاون پژوهشهای هوش مصنوعی انویدیا که در 2018 به آزمایشگاه ملحق شد، روی شبیهسازیهای فیزیکی تمرکز دارد. او و تیمش در تورنتو پروژهای تحت پلتفرم Omniverse راهاندازی کردند که هدفش تولید جهانهای شبیهسازیشده برای آموزش و ارزیابی رباتها است. یک مانع اصلی در ساخت این جهانها، کمبود و چالش استخراج داده سهبعدی از تصاویر و ویدئوهای واقعی بود؛ پاسخ انویدیا سرمایهگذاری روی «رندر تفاضلی» (differentiable rendering) بود — روشی که رندرینگ را برای یادگیری ماشین قابلبرگشت میکند و عملاً امکان تبدیل تصویر دوبعدی به مدل سهبعدی را فراهم میسازد.
انویدیا ابزارهایی مثل GANverse3D (مدل تبدیل تصویر به 3D منتشرشده در 2021) و موتور بازسازی عصبی Neuric (Neuric Neural Reconstruction Engine) را توسعه داد که از ویدئوهای دوربینهای روباتیک و خودران برای ساخت مدلهای سهبعدی و شبیهسازیهای دقیق استفاده میکنند. این فناوریها زیربنای خانوادهای از «مدلهای جهانی هوش مصنوعی» با نام Cosmos هستند که انویدیا در نمایشگاه CES معرفی کرد و اخیراً در کنفرانس SIGGRAPH از نسخههای جدید مدلها، کتابخانهها و زیرساختهای نرمافزاری ویژه توسعهدهندگان رباتیک رونمایی شد.
اهمیت سرعت و دادههای مصنوعی برای رباتها
یک تفاوت کلیدی میان شبیهسازیهای بازی و نیاز رباتها، زمان پاسخ و نرخ پردازش است. برای بازیها، پاسخ در زمان واقعی مطلوب است؛ اما رباتها میتوانند و باید برخی فرآیندها را سریعتر از زمان واقعی جهان تماشا کنند — به عنوان مثال «صد برابر سریعتر» — تا بتوانند برنامهریزی حرکت و کنترل را در شرایط متنوع و پرریسک تمرین دهند. بنابراین بهینهسازی سرعت مدلهای جهان و تولید دادههای مصنوعی (synthetic data) با کیفیت بالا، از اولویتهای اصلی است. دادههای مصنوعی ارزانتر، مقیاسپذیرتر و کنترلشدنیاند و میتوانند خلأهای داده واقعی برای آموزش شبکههای بینایی و تصمیمگیری رباتها را پر کنند.
چشمانداز و واقعبینی درباره زمانبندی
با وجود پیشرفت سریع، تیم تحقیقاتی انویدیا واقعگراست: دستیابی به رباتهای انساننما و حضور قابلاطمینان آنها در خانهها حداقل چند سال زمان میبرد. همانطور که تجربه خودروهای خودران نشان داد، هیجان عمومی اغلب با واقعیت فنی فاصله دارد. اما ترکیب پیشرفت در بینایی ماشین، مدلهای مولد و افزایش دادههای آموزشی میتواند هر یک از اجزای لازم برای رباتهای پیچیده را به سرعت تقویت کند.
جمعبندی
انویدیا از یک آزمایشگاه کوچک رندرینگ در دو دهه پیش به یک هاب تحقیقاتی برای سختافزار، نرمافزار و مدلهای هوش مصنوعی تبدیل شده است که حالا تمرکز خود را به رباتیک فیزیکی معطوف کرده است. با توسعه پلتفرمهایی مثل Omniverse، فناوریهایی مانند رندر تفاضلی، و معرفی خانواده مدلهای Cosmos و ابزارهای تولید داده مصنوعی، این شرکت در تلاش است تا زیرساخت لازم برای «مغزِ رباتها» را فراهم کند — حرکتی که میتواند جهتگیری آینده رباتیک و کاربردهای فیزیکی هوش مصنوعی را شکل دهد.
