انویدیا معماری جدید «روبین (Vera Rubin)» را در نمایشگاه CES رونمایی کرد؛ جهش قابلتوجه در سختافزار هوش مصنوعی
در مراسم امسال نمایشگاه بینالمللی مصرفکنندگان (CES)، جنسن هوانگ، مدیرعامل انویدیا (Nvidia)، بهصورت رسمی از معماری جدید محاسباتی این شرکت با نام «روبین» یا Vera Rubin پردهبرداری کرد. هوانگ این معماری را «پیشرفتهترین سختافزار برای هوش مصنوعی» توصیف کرد و اعلام نمود که تولید انبوه آن آغاز شده و انتظار میرود در نیمه دوم سال جاری بهطور گستردهتری در دسترس قرار گیرد. معرفی رسمی روبین نقطه عطفی در چرخه پرشتاب توسعه سختافزار انویدیا است که این شرکت را به یکی از ارزشمندترین شرکتهای جهان تبدیل کرده است.
آنچه معماری روبین را متمایز میکند
معماری روبین که برای اولینبار در 2024 معرفی شده بود، شامل شش تراشه مستقل است که در کنار هم برای بهینهسازی کارهای سنگین هوش مصنوعی طراحی شدهاند. تراشهٔ GPU مرکزی روبین قلب این مجموعه است، اما نوآوریهای مهم دیگری هم در این معماری گنجانده شده است:
– Vera CPU: پردازندهای جدید که برای پردازشهای مرتبط با «استدلال عاملمحور» (agentic reasoning) طراحی شده و برای سیستمهایی که نیاز به هوشمندی تصمیمگیرنده و مدیریت فرایندهای بلندمدت دارند، بهبود چشمگیری ایجاد میکند.
– بهبود در ارتباطات NVLink: برای کاهش گلوگاههای بین تراشهها و افزایش پهنای باند بین اجزای محاسباتی.
– ارتقاهای Bluefield: فناوری شبکه و مدیریت حافظه که به کاهش تأخیر و بهینهسازی عملکرد در مقیاس بزرگ کمک میکند.
– لایهٔ جدید ذخیرهسازی خارجی: انویدیا یک tier جدید ذخیرهسازی معرفی کرده که بهصورت خارجی به دستگاههای محاسباتی متصل میشود و مقیاسپذیری حافظه را برای کاربردهای نیازمند به کشهای عظیم (KV cache) بهبود میبخشد.
توضیح کوتاه درباره KV cache و اهمیت آن
KV cache به سازوکاری اشاره دارد که مدلهای هوش مصنوعی برای فشردهسازی و نگهداری ورودیها و نتایج میانی از آن استفاده میکنند. با گسترش کاربردهایی مثل هوش مصنوعی عاملمحور و وظایف طولانیمدت، نیاز به فضای کش و مدیریت آن بهسرعت رشد کرده است. لایهٔ جدید ذخیرهسازی روبین این امکان را میدهد تا ذخیرهسازی کلان (pool) را کارآمدتر گسترش داده و فشار روی حافظهٔ محلی را کاهش دهد.
عملکرد و کارایی انرژی
بر اساس آزمونهای داخلی انویدیا، معماری روبین در مقایسه با معماری قبلی بلکول (Blackwell) در آموزش مدلها بهطور میانگین 3.5 برابر سریعتر عمل میکند و در وظایف inference تا 5 برابر افزایش سرعت دارد، که در برخی موارد تا 50 پتا فلاپس هم میرسد. همچنین روبین توان پردازشی برای inference را تا 8 برابر به ازای هر وات بهبود میبخشد؛ یعنی هم سرعت بالاتر و هم بهرهوری انرژی بهتر.
استقرار و شرکای مهم
انویدیا اعلام کرده است که تراشههای روبین از هماکنون در تولید قرار دارند و تقریباً همهٔ ارائهدهندگان بزرگ ابری قرار است از آنها استفاده کنند. از جمله شرکای برجسته میتوان به Anthropic، OpenAI و Amazon Web Services اشاره کرد. علاوه بر این، سیستمهای مبتنی بر روبین در ابررایانههایی مانند Blue Lion شرکت HPE و ابررایانهٔ آینده Doudna در آزمایشگاه ملی لارنس برکلی نیز بهکار گرفته خواهند شد.
زمینه رقابتی و هزینهٔ زیرساختی
معماری روبین در زمانی معرفی شد که رقابت برای ساخت زیرساختهای هوش مصنوعی به شدت بالا گرفته است و شرکتها و آزمایشگاهها در تلاش برای تأمین تراشهها و تأسیسات لازم هستند. جنسن هوانگ در تماس با سرمایهگذاران در اکتبر 2025 تخمین زد که بین 3 تا 4 تریلیون دلار ظرف پنج سال آینده صرف زیرساختهای هوش مصنوعی خواهد شد؛ رقمی که نشاندهنده مقیاس سرمایهگذاری مورد نیاز در این حوزه است.
جمعبندی
رونمایی از معماری روبین نشان میدهد که انویدیا همچنان محور نوآوری در سختافزار هوش مصنوعی است. ترکیب تراشههای تخصصی، بهبود ارتباطات و حافظهٔ ذخیرهسازی، و تمرکز بر کارایی انرژی، روبین را برای مراکز دادهٔ بزرگ، ارائهدهندگان خدمات ابری و پروژههای تحقیقاتی سطح بالا جذاب میکند. انتظار میرود با افزایش تولید و استقرار این معماری در نیمهٔ دوم سال، تأثیر قابلتوجهی بر توان پردازشی دسترسپذیر برای توسعهٔ مدلهای پیشرفتهٔ هوش مصنوعی ایجاد شود.
