شرکت JetBrains، سازندهی ابزارهای محبوب توسعهدهی نرمافزار، اولین مدل هوش مصنوعی “باز” خود را برای کدنویسی منتشر کرده است. این شرکت روز چهارشنبه مدل Mellum را که پیشتر برای مجموعههای نرمافزاری مختلف خود ارائه داده بود، بهصورت عمومی در پلتفرم توسعه هوش مصنوعی Hugging Face در دسترس قرار داد.
مدل Mellum بر روی بیش از ۴ تریلیون توکن آموزش دیده و شامل ۴ میلیارد پارامتر میباشد. این مدل بهطور خاص برای تکمیل کد طراحی شده است؛ به این معنی که قادر است قطعات کد را بر اساس زمینهی موجود تکمیل کند. پارامترها بهطور تقریبی نشاندهندهی تواناییهای حل مسئلهی یک مدل هستند، در حالی که توکنها به عنوان واحدهای داده خامی که مدل پردازش میکند، محسوب میشوند. به عنوان مثال، یک میلیون توکن معادل تقریباً ۳۰,۰۰۰ خط کد است.
در گزارشی فنی، JetBrains توضیح میدهد: «Mellum برای ادغام در ابزارهای توسعهدهندهی حرفهای (مانند پیشنهادهای هوشمند کد در محیطهای توسعه یکپارچه)، دستیاران کدنویسی مبتنی بر هوش مصنوعی و تحقیق در زمینه کدگذاری و درک کد طراحی شده است. همچنین این مدل برای کاربردهای آموزشی و آزمایشهای تنظیم دقیق نیز مناسب میباشد.»
JetBrains اعلام کرده است که Mellum، دارای مجوز Apache 2.0، بر روی مجموعهای از دادهها از جمله کدهای مجاز از GitHub و مقالات انگلیسی ویکیپدیا آموزش دیده است. فرآیند آموزش به مدت ۲۰ روز و بر روی یک خوشه متشکل از ۲۵۶ واحد پردازشگر گرافیکی Nvidia H200 انجام شده است.
لازم به ذکر است که استفاده از این مدل نیاز به تنظیمات خاصی دارد و مدل پایه بهتنهایی قابل استفاده نیست؛ بلکه باید اول آن را تنظیم دقیق کرد. در حالی که JetBrains چند مدل از Mellum را که برای زبان برنامهنویسی Python تنظیم شدهاند، ارائه داده است، این شرکت هشدار میدهد که این مدلها تنها برای «تخمین قابلیتهای بالقوه» طراحی شدهاند و نه برای بهکارگیری در محیط تولید.
کد تولیدشده بهوسیلهی هوش مصنوعی بهطور قابل توجهی نحوهی ساخت نرمافزار را دگرگون کرده است، اما در عین حال چالشهای جدیدی در زمینه امنیت نیز به همراه دارد. بر اساس یک نظرسنجی در اواخر سال ۲۰۲۳ که توسط پلتفرم امنیتی توسعهدهندگان Synk انجام شده، بیش از ۵۰ درصد سازمانها گاهی یا بهطور مکرر با مشکلات امنیتی ناشی از کد تولیدشده هوش مصنوعی مواجه هستند.
در این راستا، JetBrains خاطرنشان کرده است که Mellum ممکن است «تعصبات موجود در پایگاههای کد عمومی را منعکس کند» و پیشنهادات کد آن الزاماً «ایمن یا بدون آسیبپذیری نخواهند بود.»
JetBrains در یک پست وبلاگی نوشت: «این تنها آغاز راه است. ما به دنبال عمومیسازی نیستیم، بلکه بر روی کانونسازی تمرکز داریم. اگر Mellum حتی یک آزمایش، مشارکت یا همکاری معنادار را ایجاد کند، ما آن را یک موفقیت میدانیم.»