XCENA با تراشهای نزدیک به DRAM؛ کاهش چشمگیر هزینههای زیرساخت هوش مصنوعی و جذب سرمایه 135 میلیون دلاری
استارتاپ XCENA که دفترهایی در کرهجنوبی و آمریکا دارد، با ارائه معماری جدیدی که محاسبات را بهجای پردازندهها در نزدیکی حافظه (DRAM) انجام میدهد، میکوشد یکی از بزرگترین گلوگاههای فعلی زیرساختهای هوش مصنوعی را حذف کند. این شرکت در تازهترین دور سرمایهگذاری سری B خود 135 میلیون دلار جذب کرد و اکنون با ارزشگذاری حدود 570 میلیون دلار مورد توجه سرمایهگذاران قرار گرفته است.
چرا حافظه (DRAM) تبدیل به گلوگاه شده است؟
هر بار که از مدلهای زبانی مانند ChatGPT سوالی میپرسیم، دادهها مسیر طولانی را طی میکنند: از حافظه خارج شده، به CPU برای پیشپردازش میرود، سپس به GPU برای محاسبات سنگین میرسد و دوباره به حافظه بازمیگردد — و این چرخه برای هر کلمه تولیدشده تکرار میشود. این تبادل مکرر بین CPU، GPU و حافظه علاوه بر کندی، مصرف انرژی و هزینههای سختافزاری را بهطور قابلتوجهی افزایش میدهد. بنابراین، بهجای آنکه مشکل فقط «محاسبات» باشد، موضوع به «مقیاسپذیری حافظه» تبدیل شده است.
راهحل XCENA: آوردن محاسبات به نزدیکی حافظه
تراشه MX1 که توسط XCENA توسعه یافته، محاسباتی را درست در ماژول حافظه انجام میدهد. این تراشه از استاندارد CXL (Compute Express Link) برای اتصال به CPU استفاده میکند؛ CXL در عمل یک مسیر اختصاصی و پرسرعت بین پردازنده و حافظه ایجاد میکند تا دادهها قبل از ترک ماژول حافظه پردازش شوند. به بیان سادهتر، بهجای انتقال مکرر دادهها بین حافظه و پردازندهها، محاسباتی مانند پیشپردازش، مدیریت کش کلید-مقدار (KV cache) و عملیات کشینگ در خود ماژول حافظه انجام میشود.
تأثیر عملی: کمتر سرور، هزینه کمتر
XCENA مدعی است کاری که پیشتر نیاز به دهها سرور داشت، با استفاده از MX1 میتواند روی تعداد بسیار کمتری از سرورها اجرا شود — حتی احتمالاً روی یک سرور. برای «هایپر اسکیلر»ها (شرکتهایی که سالانه میلیاردها دلار برای زیرساختهای هوش مصنوعی هزینه میکنند)، هر درصد بهینهسازی در مصرف حافظه معادل صرفهجویی صدها میلیون دلاری است. بنابراین بازار هدف عمده شرکت، اپراتورهای بزرگ ابری و دیتاسنترهای عظیم است.
تفاوت با GPU و نقش MX1 در زنجیره پردازش
GPUها در ضرب ماتریسی و آموزش مدلها برتر هستند، اما بخش زیادی از فعالیتهای جانبی مانند پیشپردازش دادهها، مدیریت KV cache (که حافظه حاوی زمینه گفتگو را نگه میدارد تا مدل مجبور به بازپردازش مکرر نباشد) و عملیات کشینگ همچنان روی CPU انجام میشوند. MX1 این وظایف را مستقیماً در داخل ماژول حافظه اجرا میکند و از این طریق بار روی CPU و ارتباطات مابین CPU و GPU را کاهش میدهد.
تکنولوژی و مزیت رقابتی
XCENA از هزاران هسته کوچک مبتنی بر طراحی RISC-V استفاده میکند که برای پردازش دادهها بهینه شدهاند؛ هر هسته کوچک و کارآمد طراحی شده تا مصرف انرژی و فضای سیلیکونی کنترل شود. علاوه بر هستهها، این شرکت معماری سلسلهمراتبی حافظه داخلی، باس داخلی و کنترلر DRAM مخصوص خود را طراحی کرده است — سطحی از ادغام عمودی که بسیاری از سازندگان بزرگ معمولاً آن را برونسپاری میکنند. این رویکرد میتواند مزیت IP قابل توجهی در برابر رقبایی مانند Marvell و Astera Labs ایجاد کند.
وضعیت توسعه و برنامه تجاری
MX1 فعلاً در مرحله نمونه اولیه قرار دارد و تولید انبوه آن قرار است تا پایان سال 2026 در خطوط تولید سامسونگ آغاز شود. XCENA پیشبینی میکند از سال 2027 وارد جریان درآمدی شود. این استارتاپ در سال 2022 توسط جین کیم (Jin Kim)، دوهون کیم (Dohun Kim) و هری جوهیون کیم (Harry Juhyun Kim) — هر سه با سابقه کاری در سامسونگ و SK Hynix — تأسیس شد و امروز بیش از 90 کارمند در دفاتر پانگیو (نزدیک سئول) و سانیویل دارد.
سرمایهگذاری و چشمانداز بازار
دور سری B شرکت با هدایت شرکتهای سرمایهگذاری Atinum و IMM Investment همراه بود و Corstone Asia و سرمایهگذاران قبلی از جمله SBI Investment و Mirae Asset Capital نیز مشارکت کردند. مجموع سرمایه جذبشده XCENA تا امروز به 185 میلیون دلار رسیده است. افزایش اخیر قیمتها و ارزش شرکتهای بازار حافظه—از جمله سامسونگ، SK Hynix و Micron که هر کدام برای اولین بار به ارزش بازار بیش از یک تریلیون دلار رسیدهاند—نشاندهنده انتقال گستردهای به معماریهای حافظهمحور در اکوسیستم هوش مصنوعی است که به نفع شرکتهایی مانند XCENA عمل میکند.
رقبا و جایگاه بازار
در حالی که سازندگان NPU (واحدهای پردازش عصبی) و برخی شرکتها به دنبال رقابت در بارهای کاری آموزش مدلها هستند، XCENA تمرکز خود را بر لایه حافظهمحور زیرین قرار داده است. رقبا در این حوزه شامل Marvell و Astera Labs هستند که هریک راهکارهایی برای اتصال و مدیریت حافظه ارائه میدهند؛ اما به گفته مدیرعامل XCENA، مجموعهای از هستههای تخصصی، کنترلرهای حافظه و طراحی داخلی منحصربهفرد، تمایز اصلی این شرکت را شکل میدهد.
جمعبندی
XCENA با رویکرد «محاسبات نزدیک به داده» و تراشه MX1 میکوشد هزینهها، تأخیر و مصرف انرژی مرتبط با تبادل مکرر داده بین حافظه و پردازندهها را کاهش دهد. اگر طراحی این شرکت در مقیاس گسترده عملیاتی شود، میتواند تغییر قابلتوجهی در معماری زیرساخت هوش مصنوعی ایجاد کند و برای اپراتورهای بزرگ خدمات ابری و دیتاسنترها صرفهجویی قابلتوجهی به همراه داشته باشد.
