در ادامه روند رشد مدلهای هوش مصنوعی متنباز چینی، شرکت نوپا و ناشناخته Z.ai اخیراً دو مدل جدید از نوع LLM را معرفی کرده است که با نامهای GLM-4.5 و GLM-4.5-Air شناخته میشوند. این مدلها به عنوان راهحلهای پیشرفته برای استدلال، رفتار عاملی و برنامهنویسی معرفی شدهاند و به گفتهی وبلاگ Z.ai، عملکرد آنها در مقایسه با دیگر مدلهای متنباز به شدت عالی است. به عنوان مثال، مدل GLM-4.5 در ارزیابیهای صورتگرفته در سطح استانداردهایی همچون BrowseComp و AIME24 با مدلهای برتر تجاری مانند Claude 4 Sonnet و Gemini 2.5 Pro رقابت دارد و در مجموع بر اساس دوازده آزمون مختلف، رتبه سوم را به خود اختصاص داده است.
مدل GLM-4.5-Air، نسخه سبکتری است که نیز در میان شش مدل برتر جای دارد و نتایج بسیار خوبی نسبت به مقیاس کوچکتر خود ارائه میدهد. هر دو مدل دارای دو حالت عملیاتی هستند: مد تفکر برای استدلال پیچیده و استفاده از ابزارها و مد غیرتفکری برای سناریوهای پاسخدهی فوری. این مدلها قابلیت تولید کامل ارائههای پاورپوینت از یک عنوان یا prompt واحد را دارند، که آنها را برای آمادگی در جلسات، آموزش و گزارشهای داخلی بسیار مفید میسازد. همچنین، توانایی تولید محتوای خلاقانه، کپینویسی متوجه عواطف و تولید اسکریپت برای محتواهای برند شده برای رسانههای اجتماعی و وب را دارا هستند.
علاوه بر این، این مدلها پشتیبانی از توسعه شخصیتهای مجازی و سیستمهای گفتگوی نوبتی برای پشتیبانی مشتری، بازیهای نقشآفرینی و داستانگویی شخصیت دیجیتال را نیز ارائه میدهند. در حالی که هر دو مدل از قابلیتهای استدلال، برنامهنویسی و عاملی برخوردارند، GLM-4.5-Air برای تیمهایی طراحی شده که به دنبال یک جایگزین سبکتر و اقتصادیتر با نیازهای منابع کمتر و زمان استنتاج سریعتر هستند.
مدلهای GLM-4.5 و GLM-4.5-Air تحت پروانه Apache 2.0 منتشر شدهاند که به توسعهدهندگان و سازمانها اجازه میدهد آنها را بدون محدودیت استفاده، تغییر، میزبانی شخصی، تنظیم مجدد و توزیع برای اهداف پژوهشی و تجاری به کار ببرند. این امر به ویژه برای مهندسین ارشد هوش مصنوعی و داده که مسئول ساخت و پیادهسازی مدلهای زبانی در تولید هستند، حائز اهمیت است.
مدل GLM-4.5 با ۳۵۵ میلیارد پارامتر کلی و ۳۲ میلیارد پارامتر فعال ساخته شده است، در حالی که نسخه سبکتر آن یعنی GLM-4.5-Air دارای ۱۰۶ میلیارد پارامتر کلی و ۱۲ میلیارد پارامتر فعال است. هر دو از معماری Mixture-of-Experts (MoE) بهره میبرند که با روشهای بهینهسازی مختلف بهبود یافته و به گونهای طراحی شدهاند که کارایی محاسباتی بالاتری ارائه دهند.
علاقهمندان به کار با این مدلها میتوانند به ویژگیهای مختلفی که Z.ai در پلتفرم چت خود یا از طریق ادغام API ارائه میدهد، دسترسی پیدا کنند. این مدلها با انعطافپذیری بالایی ارائه شدهاند و میتوانند به آسانی در محیطهای مختلف مانند کلود، خصوصی یا محلی پیادهسازی شوند، که این امر میتواند به طور قابل توجهی هزینهها و زمان مورد نیاز برای توسعه و آزمایش در سازمانها را کاهش دهد. با توجه به اینکه بسیاری از سازمانها به دنبال راهکارهای هوش مصنوعی با کیفیت بالا و قیمتهای مناسب هستند، معرفی این مدلها فرصتهای جدیدی برای بهرهبرداری بهینه از هوش مصنوعی در محیطهای تجاری ایجاد میکند.