کلاریفای موتور استدلال جدیدی معرفی کرد؛ دو برابر سریعتر و ۴۰٪ ارزانتر در اجرای مدلهای هوش مصنوعی
شرکت Clarifai (کلاریفای) روز پنجشنبه از «موتور استدلال» جدیدی رونمایی کرد که وعده میدهد اجرای مدلهای هوش مصنوعی را تا دو برابر سریعتر و با کاهش هزینه حدود ۴۰ درصد ممکن سازد. این فناوری که برای انواع مدلها و میزبانهای ابری طراحی شده، با بهرهگیری از مجموعهای از بهینهسازیهای نرمافزاری و سختافزاری تلاش میکند توان محاسباتی بیشتری از همان کارتهای گرافیکی استخراج کند.
چرا موتور استدلال مهم است؟
موتور استدلال بر مرحله inference تمرکز دارد؛ یعنی محاسباتی که برای اجرای یک مدل آموزشدیده لازم است. با گسترش مدلهای عاملمحور و مدلهای استدلالی چندمرحلهای، بار محاسباتی inference بهطرز چشمگیری افزایش یافته است، زیرا هر درخواست میتواند شامل چندین گام پردازشی و تولید پاسخهای واسطهای باشد. در چنین زمینهای، افزایش کارایی نرمافزاری میتواند بهاندازه افزایش ظرفیت سختافزاری اهمیت داشته باشد.
روشهای مورد استفاده
کلاریفای میگوید مجموعهای از بهینهسازیها از سطح هستههای CUDA تا تکنیکهای پیشبینی/رمزگشایی احتمالی (speculative decoding) در این موتور بهکار رفته است. این بهینهسازیها به کاهش زمان تأخیر (latency) و افزایش توان عملیاتی (throughput) کمک میکنند و اجازه میدهند همان سختافزار پاسخگویی سریعتر و اقتصادیتری ارائه دهد. به گفته متیو زایلر، مدیرعامل کلاریفای، هدف افزایش بازده سختافزار موجود است تا نیاز به گسترش بیوقفه مراکز داده کاهش یابد.
اعتبارسنجی و نتایج بنچمارک
این ادعاها توسط شرکت مستقل Artificial Analysis از طریق مجموعهای از تستهای بنچمارک بررسی و تأیید شده است؛ نتایج گزارششده رکوردهای برتر صنعتی در هر دو شاخص توان عملیاتی و تأخیر را نشان میدهد. هرچند جزئیات دقیق بنچمارکها و سناریوهای آزمایشی برای تحلیل کامل لازم است، اما تأیید سومشخص گامی مهم در اعتبارسنجی ادعاهای عملکردی محصول محسوب میشود.
سابقه و جایگاه در اکوسیستم محاسباتی
کلاریفای که فعالیتش را با خدمات بیناییکامپیوتری آغاز کرده بود، در سالهای اخیر به حوزه هماهنگی و مدیریت محاسبات (compute orchestration) وارد شده است تا به تقاضای فزاینده برای GPU و مراکز داده پاسخ دهد. این موتور استدلال اولین محصول شرکت است که بهطور ویژه برای مدلهای عاملمحور چندمرحلهای طراحی شده و پس از معرفی پلتفرم محاسباتی کلاریفای در رویداد AWS re:Invent، عرضه شده است.
اثرات گستردهتر بر بازار زیرساختهای هوش مصنوعی
افزایش تقاضا برای زیرساختهای هوش مصنوعی منجر به قراردادها و سرمایهگذاریهای عظیم در حوزه مراکز داده شده است؛ برای مثال OpenAI برنامههایی برای هزینهکردهای بسیار بزرگ در توسعه مراکز داده اعلام کرده است. در چنین شرایطی، رویکردهای نرمافزاری و الگوریتمی که کارایی را بالا برده و نیاز به افزایش ظرفیت فیزیکی را کاهش میدهند، از اهمیت ویژهای برخوردارند. زایلر تأکید میکند که علاوه بر راهکارهای نرمافزاری مانند موتور استدلال، پیشرفتهای الگوریتمی نیز میتوانند به کاهش نیاز به «دیتاسنترهای گیگاواتی» کمک کنند و هنوز راه برای نوآوریهای الگوریتمی باز است.
نتیجهگیری
معرفی موتور استدلال کلاریفای نشان میدهد که بهینهسازیهای نرمافزاری میتوانند نقش تعیینکنندهای در کاهش هزینه و افزایش سرعت اجرای مدلهای هوش مصنوعی ایفا کنند. اگر نتایج بنچمارکهای مستقل در دنیای واقعی هم بازتولید شوند، این فناوری میتواند به گزینهای جذاب برای شرکتها و توسعهدهندگان بدل شود که دنبال افزایش بهرهوری زیرساختهای AI خود هستند.
