z.ai با مدل متن‌باز GLM‑5 رکورد کمترین نرخ هالوسیناسیون را ثبت کرد و تکنیک جدید RL «Slime» را معرفی کرد

زَیپای (z.ai) مدل جدید frontier خود را معرفی کرد: GLM-5 — یک مدل زبانی بزرگ متن‌باز با هدف کاربردهای سازمانی

شرکت چینی Zhipu AI (با برند z.ai) از جدیدترین نسل مدل‌های خانواده GLM رونمایی کرد: GLM-5. این مدل که تحت مجوز MIT منتشر شده و وزن‌های آن به‌صورت متن‌باز قابل دسترس است، با تمرکز بر «قابلیت اتوماسیون کاری» و کاهش خطای ساخت مطالب (hallucination) طراحی شده و در آزمون‌های مستقل نیز به نتایج برجسته‌ای دست یافته است.

چرا GLM-5 مهم است؟
– کاهش خطاهای اطلاعاتی: در شاخص مستقل Artificial Analysis (نسخه v4.0)، GLM-5 در شاخص AA-Omniscience نمره –1 کسب کرده است؛ رقمی که نشان‌دهنده کاهش چشمگیر نرخ تولید اطلاعات نادرست و بهبود 35 واحدی نسبت به نسل قبلی است. این معیار به ویژه برای کاربردهای سازمانی حیاتی است، چون مدل باید بداند چه زمانی از پاسخ دادن خودداری کند تا اطلاعات ساختگی تولید نکند.
– متن‌باز و مناسب برای اجتناب از قفل فروشنده: انتشار تحت مجوز MIT به سازمان‌ها امکان می‌دهد مدل را در محیط‌های ابری یا درون‌سازمانی خود میزبانی کنند و وابستگی به ارائه‌دهندگان خارجی را کاهش دهند.
– طراحی برای «کار واقعی»: GLM-5 در حالت «Agent Mode» می‌تواند مستقیماً ورودی‌ها و منابع خام را به اسناد حرفه‌ای آماده استفاده (.docx, .pdf, .xlsx) تبدیل کند؛ از گزارش‌های مالی تا پیشنهادهای اسپانسرشیپ و صفحات گسترده پیچیده که به‌طور مستقیم در جریان‌های کاری سازمانی وارد می‌شوند.

ویژگی‌های فنی برجسته
– مقیاس و معماری: GLM-5 از 355 میلیارد پارامتر مدل قبلی به 744 میلیارد پارامتر رسیده و در معماری Mixture-of-Experts (MoE) تا 40 میلیارد پارامتر فعال را برای هر توکن به‌کار می‌گیرد. این افزایش پارامتری با افزایشی در داده‌های پیش‌آموزشی تا 28.5 تریلیون توکن هم‌راستا شده است.
– زیرساخت نوآورانه آموزش: برای کنترل ناکارایی‌های آموزش در این مقیاس، z.ai چارچوب جدیدی به نام «slime» معرفی کرده است — یک زیرساخت تقویت یادگیری (RL) ناهمگام (asynchronous) که با تولید مستقل تراژکتوری‌ها (trajectories) از گلوگاه‌های «دم‌طولانی» (long-tail) جلوگیری می‌کند. ترکیب بهینه‌سازی‌هایی مانند Active Partial Rollouts (APRIL) باعث کاهش شدید زمان‌های صرف‌شده در مرحله تولید نمونه‌های RL شده و چرخه‌های تکرار را برای رفتارهای عامل‌محور (agentic) به‌سرعت کوتاه‌تر می‌کند.
– مدیریت داده و جریان آموزشی: این چارچوب شامل سه ماژول اصلی است — ماژول آموزش با پشتیبانی Megatron-LM، ماژول rollout با SGLang و روترهای سفارشی برای تولید داده با توان بالا، و یک Data Buffer مرکزی برای مدیریت شروع پرامپت‌ها و ذخیره rolloutها.
– حافظه متنی بلند و بهینه‌سازی هزینه: GLM-5 از مکانیزم DeepSeek Sparse Attention (DSA) بهره می‌برد که امکان حفظ ظرفیت زمینه‌ای تا 200 هزار توکن را فراهم می‌کند، در حالی که هزینه محاسباتی را به‌طور قابل‌توجهی کاهش می‌دهد؛ مزیتی مهم برای کاربردهای طولانی‌مدت مثل اسناد حقوقی یا تحلیل‌های مالی با زمینه وسیع.

عملکرد و قیمت‌گذاری
z.ai گزارش داده که GLM-5 در چند بنچمارک کلیدی عملکرد نزدیک به سطح پیشتازان قرار گرفته است؛ برای مثال در SWE-bench Verified نمره 77.8 کسب کرده که بالاتر از Gemini 3 Pro و نزدیک به Claude Opus 4.6 است. در آزمون‌های شبیه‌سازی کسب‌وکار نیز در میان مدل‌های متن‌باز رتبه بالا داشته است. از نظر هزینه، GLM-5 در زمان انتشار (فبروری 11، 2026) روی پلتفرم‌هایی مانند OpenRouter با قیمت حدود 0.80–1.00 دلار به ازای هر 1 میلیون توکن ورودی و 2.56–3.20 دلار به ازای هر 1 میلیون توکن خروجی عرضه شده که در مقایسه با برخی رقبای تجاری، هزینه ورودی و خروجی کمتری را نشان می‌دهد. این نقطه قیمت‌گذاری می‌تواند برای سازمان‌هایی که به دنبال agentic engineering مقرون‌به‌صرفه هستند، جذاب باشد.

ملاحظات ایمنی، عملیاتی و حقوقی
– محدودیت‌های زیرساختی: مدل 744B پارامتری نیازمند سطح بالایی از منابع محاسباتی است؛ میزبانی محلی برای شرکت‌های کوچک ممکن است ناممکن یا پرهزینه باشد و نیاز به خوشه‌های GPU بزرگ یا خدمات ابری قوی دارد.
– نگرانی‌های رفتاری و ایمنی: برخی متخصصان ایمنی مدل‌ها هشدار داده‌اند که عملکرد بالا در بنچمارک به‌تنهایی به معنای «درک موقعیتی» یا رفتار مسئولانه نیست. نمونه‌ای از انتقادها اشاره می‌کند که مدل ممکن است برای دستیابی به اهداف «رفتارهای تهاجمی» اتخاذ کند بدون آنکه تجربه یا ملاحظات ایمنی را در نظر بگیرد؛ مسئله‌ای که در متون علمی به‌عنوان خطراتی شبیه «paperclip maximizer» مطرح شده است.
– حاکمیت و مقررات: برای صنایع تنظیم‌شده اهمیت ویژه‌ای دارد که منابع داده، محل میزبانی، و ردیابی تاریخی تصمیمات مدل قابل گزارش و ممیزی باشد. حرکت از «چت» به «عامل‌های خودگردان» نیازمند سازوکارهای دسترسی، مجوزهای خاص عامل و درگاه‌های انسانی (human-in-the-loop) برای کنترل کیفیت و جلوگیری از خطاهای خودکار است.
– ریسک ژئوپولیتیکی: استفاده از مدل‌های پیشرفته تولیدشده توسط آزمایشگاه‌های خارج از حوزه جغرافیایی شرکت ممکن است در برخی بازارها یا قراردادهای دولتی چالش‌زا باشد؛ سازمان‌ها باید مسائل مربوط به حاکمیت داده و انطباق را بررسی کنند.

برای چه سازمان‌هایی مناسب است؟
GLM-5 برای شرکت‌ها و تیم‌های مهندسی که از copilots ساده فراتر رفته‌اند و به دنبال خودکارسازی کامل‌تری در جریان‌های کاری سازمانی—مثل تولید خودکار گزارش‌ها، بازسازی بک‌اندهای قدیمی یا ایجاد «پایپلاین‌های خودترمیم»—هستند، گزینه‌ای جدی محسوب می‌شود. سازمان‌هایی که منابع محاسباتی، تیم‌های امنیت داده و سیاست‌های حاکمیتی مناسب دارند، می‌توانند از متن‌باز بودن و توانمندی‌های agentic مدل بهره ببرند؛ اما شرکت‌های کوچک‌تر یا سازمان‌های با محدودیت‌های مقرراتی باید با احتیاط و پس از ارزیابی ریسک و هزینه وارد شوند.

جمع‌بندی
GLM-5 گامی مهم در جهت ساخت مدل‌های زبانی بزرگ طراحی‌شده برای اجرا و خودکارسازی کارهای واقعی است: ترکیب مقیاس بزرگ، معماری‌های MoE، بهبودهای زیرساختی آموزشی و تمرکز ویژه بر خروجی‌های آماده‌کار سازمانی. انتشار متن‌باز و قیمت‌گذاری رقابتی آن، این مدل را برای بسیاری از سازمان‌ها جذاب می‌سازد؛ اما نیاز به زیرساخت‌های پرهزینه، چالش‌های ایمنی و ملاحظات حاکمیتی از جمله مواردی است که پیش از استفاده باید به دقت سنجیده شود.

تبدیل متن‌ به صوت

z.ai با مدل متن‌باز GLM‑5 رکورد کمترین نرخ هالوسیناسیون را ثبت کرد و تکنیک جدید RL «Slime» را معرفی کرد

دیدگاه‌ خود را بنویسید لغو پاسخ