شرکت فرانسوی «میسترال» (Mistral) به تازگی به ارائه مدلهای هوش مصنوعی خود بهویژه مدلهای منبع باز بازگشته است. این شرکت که در پاییز 2023 با ابراز قدرت خود در حوزه مدلهای بزرگ منبع باز (Foundation Models) شناختهشده است، اخیراً در فضای شبکههای اجتماعی، انتقادات متفاوتی را به دلیل انتشار مدل زبانی اختصاصی «مدیوم 3» (Medium 3) دریافت کرد. برخی توسعهدهندگان معتقد بودند که این حرکت، به معنای کنار گذاشتن ریشههای منبع باز این شرکت است.
اما «میسترال» از آن زمان دوباره به جامعه هوش مصنوعی منبع باز متعهد شده و بهویژه در زمینه توسعه نرمافزارهای هوشافزا، گام بزرگی برداشته است. این شرکت با همکاری استارتاپ منبع باز «All Hands AI» که خالق «Open Devin» است، مدل زبانی جدیدی به نام «Devstral» را عرضه کرده است. Devstral با ۲۴ میلیون پارامتر، به وضوح از بسیاری از رقبای خود که دارای چندین میلیارد پارامتر هستند، کوچکتر است و به همین دلیل به راحتی میتوان آن را بر روی لپتاپها اجرا کرد. این مدل بهطور خاص برای توسعه هوش مصنوعی فعال طراحی شده است.
برخلاف مدلهای بزرگ زبان سنتی که بیشتر برای تکمیل کدهای کوتاه یا تولید توابع مجزا استفاده میشوند، Devstral به گونهای بهینهسازی شده است که به عنوان یک عامل کامل در مهندسی نرمافزار عمل کند و قادر به درک زمینه در فایلهای مختلف، ناوبری در کدهای بزرگ و حل مسائل واقعی است. این مدل تحت مجوزApache 2.0 به صورت رایگان در دسترس قرار دارد و به توسعهدهندگان و سازمانها اجازه میدهد که آن را بدون محدودیت منتشر، اصلاح و تجاریسازی کنند.
بتیست روژیره، محقق «میسترال» در این باره گفت: “ما میخواستیم چیزی را برای جامعه توسعهدهندگان و علاقهمندان منتشر کنیم که بتوانند به صورت محلی، خصوصی اجرا کرده و به دلخواه تغییر دهند.”
Devstral نمایانگر مرحله جدیدی در مجموعه مدلهای متمرکز بر کد «میسترال» است و با موفقیتهای قبلی این شرکت در سری «CodeStral» همراستا شده است. این مدل بهروزرسانیهای سریع و قابل توجهی را به دنبال داشت و نه تنها در کلیه معیارهای عملکرد، بلکه در مقایسه با مدلهای دیگری مانند GPT-4.1-mini بهبودهای چشمگیری را ارائه داده است.
علاوه بر عملکرد و قابلیت سفر، مجوز Apache 2.0 این مدل، انتخابی جذاب برای استفادههای تجاری به شمار میرود. دستورالعملهای دقیق و مشخصات استفاده از این مدل، بر روی صفحه مدل Devstral- Small-2505 در Hugging Face موجود است.
در نهایت، طبق اظهارات روژیره، قرار است «میسترال» و «All Hands AI» به توسعه مدلهای بزرگتر و با قابلیتهای گستردهتر ادامه دهند. این مدل نه تنها به عنوان ابزاری برای تولید کد عمل میکند، بلکه پایهای برای ساخت سیستمهای خودکار مهندسی نرمافزار به شمار میرود.