برتری مدل منبع باز Qwen3-235B-A22B-2507 علی‌بابا بر Kimi-2 و نسخه کم محاسبه آن

به تازگی غول تجارت الکترونیک چین، علی‌بابا، با خانواده‌ای از مدل‌های زبان مولد “کون” (Qwen) در جوامع فناوری و کسب‌وکار جهانی تحولی بزرگ به وجود آورده است. این تحولات از زمان راه‌اندازی چت‌بات LLM اصلی “تونگی چیان‌ون” در آوریل 2023 آغاز شده و تا معرفی مدل “Qwen 3” در آوریل 2025 ادامه خواهد داشت. چرا این پروژه اینقدر توجهات را جلب کرده است؟ مدل‌های کون نه تنها از قدرت بالایی برخوردارند و در آزمون‌های معیار سومی در زمینه‌های ریاضی، علوم، استدلال و نوشتن نمرات بالایی کسب کرده‌اند، بلکه بیشتر آن‌ها تحت مجوزهای منبع باز آزاد منتشر شده‌اند که به سازمان‌ها و شرکت‌ها این امکان را می‌دهد تا آن‌ها را دانلود، سفارشی‌سازی و حتی در کاربردهای تجاری استفاده کنند.

این هفته تیم “کون” علی‌بابا، به‌روزرسانی‌های جدیدی را برای خانواده کون منتشر کرد که دوباره توجه کاربران قدرت‌مند هوش مصنوعی در غرب را به خود جلب کرده است. در یکی از این به‌روزرسانی‌ها، مدل “Qwen3-235B-A22B-2507-Instruct” روانه بازار شد که بهبودهای عمده‌ای در زمینه‌های استدلال، دقت واقعی و درک چند زبانه به همراه دارد. این مدل همچنین نسبت به نسخه غیر تفکر مدل کلود اپوس 4 عملکرد بهتری دارد.

مدل جدید “Qwen3” همچنین نتایج بهتری در زمینه کدنویسی، تطابق با ترجیحات کاربران و مدیریت متن‌های طولانی ارائه می‌دهد. علاوه بر این، تیم کون نسخه جدیدی به نام “FP8” را معرفی کرده است که به کاهش مصرف حافظه و قدرت پردازش کمک می‌کند، بدون اینکه تأثیر زیادی بر عملکرد کلی مدل بگذارد. این ویژگی به شرکت‌ها این امکان را می‌دهد تا مدل‌های با ظرفیت “قون 3” را بر روی سخت‌افزارهای کمتر قدرتمند اجرا کنند و این به معنای زمان پاسخ‌گویی سریع‌تر و هزینه‌های انرژی کمتر است.

جالب‌ترین بخش این به‌روزرسانی، تصمیم تیم کون به قطع ارتباط بین دو رویکرد “تفکر ترکیبی” و “تعلیم” است. با این تغییر، مدل‌های جداگانه برای وظایف تدریس و استدلال آموزش داده می‌شوند، که منجر به نتایج پیش‌بینی‌پذیرتر و واکنش‌های بهتر نسبت به دستورات کاربران می‌شود.

علی‌بابا همچنین “Kwan-Agent” را معرفی کرد که چهارچوبی سبک برای کاربران برای ایجاد سیستم‌های هوشمند و تعاملی است. این به‌روزرسانی به خوبی مورد استقبال کاربران قدرت‌مند هوش مصنوعی قرار گرفته و بررسی‌های مختلف نشان می‌دهند که مدل جدید نسبت به رقبای خود مانند “Claude Opus 4” و “Kimi K2” عملکرد بهتری دارد.

مدل “Qwen3-235B-A22B-Instruct-2507” نه تنها به سادگی در دسترس است، بلکه مجوز Apache 2.0 به کاربران این امکان را می‌دهد که بدون محدودیت‌های سخت‌گیرانه از آن بهره‌برداری تجاری کنند. با وجود این، علی‌بابا در حال برنامه‌ریزی برای به‌روزرسانی‌های آینده است و مدل‌های جدیدی با قابلیت‌های پیشرفته‌تری در دست ساخت دارد.

با توجه به تمامی این تحولات، مدل “Qwen3” به عنوان یک کاندیدای جدی برای تیم‌هایی که به دنبال ادغام مدل‌های پیشرفته در ساختار هوش مصنوعی خود هستند، به حساب می‌آید و نه تنها قابلیت‌ها و عملکرد جهانی بی‌نظیری را ارائه می‌دهد بلکه با مجوزهای دوستانه‌اش، فرصت‌های زیادی را برای توسعه و پیاده‌سازی فراهم می‌کند.

چت بات پیشرفته

برتری مدل منبع باز Qwen3-235B-A22B-2507 علی‌بابا بر Kimi-2 و نسخه کم محاسبه آن

دیدگاه‌ خود را بنویسید لغو پاسخ