گروه تحقیقاتی “کیوئِن” از غول تجارت الکترونیکی چین علیبابا، بار دیگر توانسته است توجهات را جلب کند. این گروه چند روز پس از انتشار رایگان و با مجوز متن باز مدل زبان بزرگ غیر استدلالی برتر جهانی، که با نام طولانی “کیوئِن ۳-۲۳۵B-A22B-2507” شناخته میشود، از مدل جدیدی به نام “کیوئِن ۳-کودر-۴۸۰B-A35B-اینستراک” رونمایی کرده است. این مدل متن باز به طور خاص برای کمک به توسعه نرمافزار طراحی شده و قادر است workflows پیچیده چند مرحلهای برنامهنویسی را مدیریت کند و در چند ثانیه یا دقیقه، برنامههای کاربردی کامل و عملی تولید کند.
این مدل، به عنوان رقیبی جدی برای راهکارهای اختصاصی مانند “کلاود سونت-۴” در وظایف برنامهنویسی ایجنتیک معرفی میشود و نمرات جدیدی را در میان مدلهای متن باز به ثبت رسانده است. کیوئِن ۳-کودر اکنون بر روی پلتفرمهای “هاگینگ فیس”، “گیتهاب”، “کیوئِن چت” و همچنین از طریق API کیوئِن علیبابا قابل دسترسی است. به علاوه، این مدل با مجوز متن باز Apache 2.0 ارائه شده است، به این معنی که کلیه مشاغل میتوانند بدون هیچگونه هزینهای آن را دانلود، اصلاح و در برنامههای تجاری خود استفاده کنند.
این مدل با بکارگیری تکنیکهای جدید و نوآورانه، عملکرد قابل توجهی را در بنچمارکهای سوم شخص و استفادههای آنی در زمینه «کدنویسی ویبی» به ثبت رسانده است. این مدل بر اساس Mixture-of-Experts (MoE) با ۴۸۰ میلیارد پارامتر ساخته شده و به طور بومی از طول کانتکست ۲۵۶K توکن پشتیبانی میکند. همچنین از طریق YaRN (Yet another RoPE extrapolatioN) میتوان ظرفیت آن را تا ۱ میلیون توکن افزایش داد.
طراحی این مدل به شکلی است که میتواند مستقیماً در محیطهای توسعهدهنده متصل شود و همچنین از نظر عملکرد، بهینهسازیهایی برای کارایی بالا در پیروی از دستورالعملها و کاهش زمان پاسخدهی نیز به عمل آمده است. بررسیها نشان میدهد که قویترین عملکرد را در میان مدلهای باز و همچنین در زمینههای مختلفی چون استفاده از مرورگرهای ایجنتیک، برنامهنویسی چند زبانه و استفاده از ابزارها دارد.
به منظور بهبود تجربیات توسعهدهندگان، گروه کیوئِن ابزار جدیدی به نام “کیوئِن کد” را همچنین معرفی کرده است که از عملکردهای ساختاریافته و فراخوانی توابع پشتیبانی میکند.
انتظار میرود که این مدل علاوه بر پاسخگویی به نیازهای بزرگترین شرکتهای فناوری، توجه تیمهای توسعهگر کوچکتر را نیز به خود جلب کند. به دنبال آزمایشات مثبت و انتقادات سازنده از سوی پژوهشگران و مهندسان، این مدل درواقع گزینهای پیشرو برای شیوههای تولید AI در محیطهای مختلف از جمله شرکتهای بزرگ و استارتاپهای کوچک به شمار میآید.
گروه کیوئِن اعلام کرده است که در حال توسعه نسخههای جدیدی از این مدل است که با هزینههای پیادهسازی کمتر، قابلیتهای مشابهی را ارائه خواهد داد. این مدل با توانایی خود در پردازش زمینههای وسیع و استدلالهای طولانی، به یک گزینه جذاب برای پیادهسازی در تولیدات بزرگتر تبدیل شده است.