مایکروسافت چیپ Maia 200 را برای مقیاسپذیری اینفرانس هوش مصنوعی معرفی کرد
مایکروسافت از جدیدترین چیپ خود با نام Maia 200 رونمایی کرد؛ یک «سیلیکون کارآمد» که هدف آن بهینهسازی و تسریع فرایند اینفرانس (اجرای مدلهای هوش مصنوعی) است. این تراشه که جایگزین Maia 100 عرضهشده در 2023 میشود، بهگونهای طراحی شده تا مدلهای بزرگ هوش مصنوعی را با سرعت بالاتر و مصرف انرژی کمتر اجرا کند.
ویژگیهای فنی و عملکرد
– Maia 200 بیش از 100 میلیارد ترانزیستور دارد و در دقت 4-بیتی بیش از 10 پتافلاپس و در دقت 8-بیتی تقریباً 5 پتافلاپس توان محاسباتی ارائه میکند؛ جهشی قابلتوجه نسبت به نسل پیشین.
– مایکروسافت میگوید یک نود Maia 200 میتواند بهراحتی بزرگترین مدلهای فعلی را اجرا کند و ظرفیت کافی برای مدلهای بزرگتر آینده نیز دارد.
– این چیپ بهویژه برای بارهای کاری اینفرانس بهینه شده؛ یعنی اجرای مدلهایی که قبلاً آموزش دیدهاند (در مقابل محاسبات سنگین و پرهزینه مربوط به آموزش مدل).
اهمیت برای کسبوکارها و هزینههای عملیاتی
با بلوغ شرکتهای فعال در حوزه هوش مصنوعی، هزینههای مربوط به اینفرانس سهم قابلتوجهی از هزینههای عملیاتی را تشکیل میدهد. کاهش هزینههای اینفرانس و افزایش بازدهی انرژی میتواند به کاهش هزینه کلی سرویسها و افزایش پایداری زیرساختها منجر شود. مایکروسافت معتقد است Maia 200 میتواند بخشی از این بهینهسازی باشد و عملکرد سرویسها را با اختلال کمتر و مصرف برق پایینتر بهبود دهد.
رقابت با غولهای تکنولوژی و کاهش وابستگی به انویدیا
معرفی Maia 200 در ادامه روندی است که شرکتهای بزرگ فناوری را به طراحی تراشههای اختصاصی خود سوق داده است تا وابستگی به پردازندههای گرافیکی انویدیا کاهش یابد. بهعنوان مثال، گوگل واحدهای TPU خود را ارائه کرده و آمازون نیز با Trainium وارد بازار شتابدهندههای AI شده است. در بیانیه مایکروسافت آمده که عملکرد FP4 این تراشه سه برابر نسل سوم Trainium آمازون است و عملکرد FP8 آن از نسل هفتم TPU گوگل پیشی میگیرد.
موارد استفاده فعلی و دسترسی توسعهدهندگان
مایکروسافت اعلام کرده که Maia 200 هماکنون در کارکرد مدلهای تیم Superintelligence این شرکت و در پشتیبانی از سرویسهایی مانند Copilot به کار گرفته شده است. علاوه بر این، شرکت توسعهدهندگان، دانشگاهیان و آزمایشگاههای پیشرو در حوزه هوش مصنوعی را به استفاده از کیت توسعه نرمافزاری (SDK) Maia 200 در بارهای کاری خود دعوت کرده است تا امکان ارزیابی و یکپارچهسازی این تراشه فراهم شود.
جمعبندی
Maia 200 گام دیگری از مایکروسافت در جهت خودکفایی سختافزاری و بهینهسازی اجرای مدلهای بزرگ هوش مصنوعی است. با توجه به ارقام عملکردی اعلامشده و تمرکز روی اینفرانس، این تراشه میتواند نقش مهمی در کاهش هزینهها و مصرف انرژی کسبوکارهای مبتنی بر AI ایفا کند و رقابت میان تامینکنندگان سختافزار شتابدهنده هوش مصنوعی را تشدید کند.
