به تازگی غول تجارت الکترونیک چین، علیبابا، با خانوادهای از مدلهای زبان مولد “کون” (Qwen) در جوامع فناوری و کسبوکار جهانی تحولی بزرگ به وجود آورده است. این تحولات از زمان راهاندازی چتبات LLM اصلی “تونگی چیانون” در آوریل 2023 آغاز شده و تا معرفی مدل “Qwen 3” در آوریل 2025 ادامه خواهد داشت. چرا این پروژه اینقدر توجهات را جلب کرده است؟ مدلهای کون نه تنها از قدرت بالایی برخوردارند و در آزمونهای معیار سومی در زمینههای ریاضی، علوم، استدلال و نوشتن نمرات بالایی کسب کردهاند، بلکه بیشتر آنها تحت مجوزهای منبع باز آزاد منتشر شدهاند که به سازمانها و شرکتها این امکان را میدهد تا آنها را دانلود، سفارشیسازی و حتی در کاربردهای تجاری استفاده کنند.
این هفته تیم “کون” علیبابا، بهروزرسانیهای جدیدی را برای خانواده کون منتشر کرد که دوباره توجه کاربران قدرتمند هوش مصنوعی در غرب را به خود جلب کرده است. در یکی از این بهروزرسانیها، مدل “Qwen3-235B-A22B-2507-Instruct” روانه بازار شد که بهبودهای عمدهای در زمینههای استدلال، دقت واقعی و درک چند زبانه به همراه دارد. این مدل همچنین نسبت به نسخه غیر تفکر مدل کلود اپوس 4 عملکرد بهتری دارد.
مدل جدید “Qwen3” همچنین نتایج بهتری در زمینه کدنویسی، تطابق با ترجیحات کاربران و مدیریت متنهای طولانی ارائه میدهد. علاوه بر این، تیم کون نسخه جدیدی به نام “FP8” را معرفی کرده است که به کاهش مصرف حافظه و قدرت پردازش کمک میکند، بدون اینکه تأثیر زیادی بر عملکرد کلی مدل بگذارد. این ویژگی به شرکتها این امکان را میدهد تا مدلهای با ظرفیت “قون 3” را بر روی سختافزارهای کمتر قدرتمند اجرا کنند و این به معنای زمان پاسخگویی سریعتر و هزینههای انرژی کمتر است.
جالبترین بخش این بهروزرسانی، تصمیم تیم کون به قطع ارتباط بین دو رویکرد “تفکر ترکیبی” و “تعلیم” است. با این تغییر، مدلهای جداگانه برای وظایف تدریس و استدلال آموزش داده میشوند، که منجر به نتایج پیشبینیپذیرتر و واکنشهای بهتر نسبت به دستورات کاربران میشود.
علیبابا همچنین “Kwan-Agent” را معرفی کرد که چهارچوبی سبک برای کاربران برای ایجاد سیستمهای هوشمند و تعاملی است. این بهروزرسانی به خوبی مورد استقبال کاربران قدرتمند هوش مصنوعی قرار گرفته و بررسیهای مختلف نشان میدهند که مدل جدید نسبت به رقبای خود مانند “Claude Opus 4” و “Kimi K2” عملکرد بهتری دارد.
مدل “Qwen3-235B-A22B-Instruct-2507” نه تنها به سادگی در دسترس است، بلکه مجوز Apache 2.0 به کاربران این امکان را میدهد که بدون محدودیتهای سختگیرانه از آن بهرهبرداری تجاری کنند. با وجود این، علیبابا در حال برنامهریزی برای بهروزرسانیهای آینده است و مدلهای جدیدی با قابلیتهای پیشرفتهتری در دست ساخت دارد.
با توجه به تمامی این تحولات، مدل “Qwen3” به عنوان یک کاندیدای جدی برای تیمهایی که به دنبال ادغام مدلهای پیشرفته در ساختار هوش مصنوعی خود هستند، به حساب میآید و نه تنها قابلیتها و عملکرد جهانی بینظیری را ارائه میدهد بلکه با مجوزهای دوستانهاش، فرصتهای زیادی را برای توسعه و پیادهسازی فراهم میکند.