XCENA با تراشه‌ای نزدیک به DRAM؛ کاهش چشمگیر هزینه‌های زیرساخت هوش مصنوعی و جذب سرمایه 135 میلیون دلاری

استارتاپ XCENA که دفترهایی در کره‌جنوبی و آمریکا دارد، با ارائه معماری جدیدی که محاسبات را به‌جای پردازنده‌ها در نزدیکی حافظه (DRAM) انجام می‌دهد، می‌کوشد یکی از بزرگ‌ترین گلوگاه‌های فعلی زیرساخت‌های هوش مصنوعی را حذف کند. این شرکت در تازه‌ترین دور سرمایه‌گذاری سری B خود 135 میلیون دلار جذب کرد و اکنون با ارزش‌گذاری حدود 570 میلیون دلار مورد توجه سرمایه‌گذاران قرار گرفته است.

چرا حافظه (DRAM) تبدیل به گلوگاه شده است؟
هر بار که از مدل‌های زبانی مانند ChatGPT سوالی می‌پرسیم، داده‌ها مسیر طولانی را طی می‌کنند: از حافظه خارج شده، به CPU برای پیش‌پردازش می‌رود، سپس به GPU برای محاسبات سنگین می‌رسد و دوباره به حافظه بازمی‌گردد — و این چرخه برای هر کلمه تولیدشده تکرار می‌شود. این تبادل مکرر بین CPU، GPU و حافظه علاوه بر کندی، مصرف انرژی و هزینه‌های سخت‌افزاری را به‌طور قابل‌توجهی افزایش می‌دهد. بنابراین، به‌جای آنکه مشکل فقط «محاسبات» باشد، موضوع به «مقیاس‌پذیری حافظه» تبدیل شده است.

راه‌حل XCENA: آوردن محاسبات به نزدیکی حافظه
تراشه MX1 که توسط XCENA توسعه یافته، محاسباتی را درست در ماژول حافظه انجام می‌دهد. این تراشه از استاندارد CXL (Compute Express Link) برای اتصال به CPU استفاده می‌کند؛ CXL در عمل یک مسیر اختصاصی و پرسرعت بین پردازنده و حافظه ایجاد می‌کند تا داده‌ها قبل از ترک ماژول حافظه پردازش شوند. به بیان ساده‌تر، به‌جای انتقال مکرر داده‌ها بین حافظه و پردازنده‌ها، محاسباتی مانند پیش‌پردازش، مدیریت کش کلید-مقدار (KV cache) و عملیات کشینگ در خود ماژول حافظه انجام می‌شود.

تأثیر عملی: کمتر سرور، هزینه کمتر
XCENA مدعی است کاری که پیش‌تر نیاز به ده‌ها سرور داشت، با استفاده از MX1 می‌تواند روی تعداد بسیار کمتری از سرورها اجرا شود — حتی احتمالاً روی یک سرور. برای «هایپر اسکیلر»ها (شرکت‌هایی که سالانه میلیاردها دلار برای زیرساخت‌های هوش مصنوعی هزینه می‌کنند)، هر درصد بهینه‌سازی در مصرف حافظه معادل صرفه‌جویی صدها میلیون دلاری است. بنابراین بازار هدف عمده شرکت، اپراتورهای بزرگ ابری و دیتاسنترهای عظیم است.

تفاوت با GPU و نقش MX1 در زنجیره پردازش
GPUها در ضرب ماتریسی و آموزش مدل‌ها برتر هستند، اما بخش زیادی از فعالیت‌های جانبی مانند پیش‌پردازش داده‌ها، مدیریت KV cache (که حافظه حاوی زمینه گفتگو را نگه می‌دارد تا مدل مجبور به بازپردازش مکرر نباشد) و عملیات کشینگ همچنان روی CPU انجام می‌شوند. MX1 این وظایف را مستقیماً در داخل ماژول حافظه اجرا می‌کند و از این طریق بار روی CPU و ارتباطات مابین CPU و GPU را کاهش می‌دهد.

تکنولوژی و مزیت رقابتی
XCENA از هزاران هسته کوچک مبتنی بر طراحی RISC-V استفاده می‌کند که برای پردازش داده‌ها بهینه شده‌اند؛ هر هسته کوچک و کارآمد طراحی شده تا مصرف انرژی و فضای سیلیکونی کنترل شود. علاوه بر هسته‌ها، این شرکت معماری سلسله‌مراتبی حافظه داخلی، باس داخلی و کنترلر DRAM مخصوص خود را طراحی کرده است — سطحی از ادغام عمودی که بسیاری از سازندگان بزرگ معمولاً آن را برون‌سپاری می‌کنند. این رویکرد می‌تواند مزیت IP قابل توجهی در برابر رقبایی مانند Marvell و Astera Labs ایجاد کند.

وضعیت توسعه و برنامه تجاری
MX1 فعلاً در مرحله نمونه اولیه قرار دارد و تولید انبوه آن قرار است تا پایان سال 2026 در خطوط تولید سامسونگ آغاز شود. XCENA پیش‌بینی می‌کند از سال 2027 وارد جریان درآمدی شود. این استارتاپ در سال 2022 توسط جین کیم (Jin Kim)، دوهون کیم (Dohun Kim) و هری جوهیون کیم (Harry Juhyun Kim) — هر سه با سابقه کاری در سامسونگ و SK Hynix — تأسیس شد و امروز بیش از 90 کارمند در دفاتر پانگیو (نزدیک سئول) و سانی‌ویل دارد.

سرمایه‌گذاری و چشم‌انداز بازار
دور سری B شرکت با هدایت شرکت‌های سرمایه‌گذاری Atinum و IMM Investment همراه بود و Corstone Asia و سرمایه‌گذاران قبلی از جمله SBI Investment و Mirae Asset Capital نیز مشارکت کردند. مجموع سرمایه جذب‌شده XCENA تا امروز به 185 میلیون دلار رسیده است. افزایش اخیر قیمت‌ها و ارزش شرکت‌های بازار حافظه—از جمله سامسونگ، SK Hynix و Micron که هر کدام برای اولین بار به ارزش بازار بیش از یک تریلیون دلار رسیده‌اند—نشان‌دهنده انتقال گسترده‌ای به معماری‌های حافظه‌محور در اکوسیستم هوش مصنوعی است که به نفع شرکت‌هایی مانند XCENA عمل می‌کند.

رقبا و جایگاه بازار
در حالی که سازندگان NPU (واحدهای پردازش عصبی) و برخی شرکت‌ها به دنبال رقابت در بارهای کاری آموزش مدل‌ها هستند، XCENA تمرکز خود را بر لایه حافظه‌محور زیرین قرار داده است. رقبا در این حوزه شامل Marvell و Astera Labs هستند که هریک راهکارهایی برای اتصال و مدیریت حافظه ارائه می‌دهند؛ اما به گفته مدیرعامل XCENA، مجموعه‌ای از هسته‌های تخصصی، کنترلرهای حافظه و طراحی داخلی منحصربه‌فرد، تمایز اصلی این شرکت را شکل می‌دهد.

جمع‌بندی
XCENA با رویکرد «محاسبات نزدیک به داده» و تراشه MX1 می‌کوشد هزینه‌ها، تأخیر و مصرف انرژی مرتبط با تبادل مکرر داده بین حافظه و پردازنده‌ها را کاهش دهد. اگر طراحی این شرکت در مقیاس گسترده عملیاتی شود، می‌تواند تغییر قابل‌توجهی در معماری زیرساخت هوش مصنوعی ایجاد کند و برای اپراتورهای بزرگ خدمات ابری و دیتاسنترها صرفه‌جویی قابل‌توجهی به همراه داشته باشد.

تبدیل نوشتار به گفتار

دیدگاه‌ خود را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

اسکرول به بالا