شرکت JetBrains، سازنده‌ی ابزارهای محبوب توسعه‌دهی نرم‌افزار، اولین مدل هوش مصنوعی “باز” خود را برای کدنویسی منتشر کرده است. این شرکت روز چهارشنبه مدل Mellum را که پیش‌تر برای مجموعه‌های نرم‌افزاری مختلف خود ارائه داده بود، به‌صورت عمومی در پلتفرم توسعه هوش مصنوعی Hugging Face در دسترس قرار داد.

مدل Mellum بر روی بیش از ۴ تریلیون توکن آموزش دیده و شامل ۴ میلیارد پارامتر می‌باشد. این مدل به‌طور خاص برای تکمیل کد طراحی شده است؛ به این معنی که قادر است قطعات کد را بر اساس زمینه‌ی موجود تکمیل کند. پارامترها به‌طور تقریبی نشان‌دهنده‌ی توانایی‌های حل مسئله‌ی یک مدل هستند، در حالی که توکن‌ها به عنوان واحدهای داده خامی که مدل پردازش می‌کند، محسوب می‌شوند. به عنوان مثال، یک میلیون توکن معادل تقریباً ۳۰,۰۰۰ خط کد است.

در گزارشی فنی، JetBrains توضیح می‌دهد: «Mellum برای ادغام در ابزارهای توسعه‌دهنده‌ی حرفه‌ای (مانند پیشنهادهای هوشمند کد در محیط‌های توسعه یکپارچه)، دستیاران کدنویسی مبتنی بر هوش مصنوعی و تحقیق در زمینه‌ کدگذاری و درک کد طراحی شده است. همچنین این مدل برای کاربردهای آموزشی و آزمایش‌های تنظیم دقیق نیز مناسب می‌باشد.»

JetBrains اعلام کرده است که Mellum، دارای مجوز Apache 2.0، بر روی مجموعه‌ای از داده‌ها از جمله کدهای مجاز از GitHub و مقالات انگلیسی ویکی‌پدیا آموزش دیده است. فرآیند آموزش به مدت ۲۰ روز و بر روی یک خوشه متشکل از ۲۵۶ واحد پردازشگر گرافیکی Nvidia H200 انجام شده است.

لازم به ذکر است که استفاده از این مدل نیاز به تنظیمات خاصی دارد و مدل پایه به‌تنهایی قابل استفاده نیست؛ بلکه باید اول آن را تنظیم دقیق کرد. در حالی که JetBrains چند مدل از Mellum را که برای زبان برنامه‌نویسی Python تنظیم شده‌اند، ارائه داده است، این شرکت هشدار می‌دهد که این مدل‌ها تنها برای «تخمین قابلیت‌های بالقوه» طراحی شده‌اند و نه برای به‌کارگیری در محیط تولید.

کد تولید‌شده به‌وسیله‌ی هوش مصنوعی به‌طور قابل توجهی نحوه‌ی ساخت نرم‌افزار را دگرگون کرده است، اما در عین حال چالش‌های جدیدی در زمینه امنیت نیز به همراه دارد. بر اساس یک نظرسنجی در اواخر سال ۲۰۲۳ که توسط پلتفرم امنیتی توسعه‌دهندگان Synk انجام شده، بیش از ۵۰ درصد سازمان‌ها گاهی یا به‌طور مکرر با مشکلات امنیتی ناشی از کد تولیدشده هوش مصنوعی مواجه هستند.

در این راستا، JetBrains خاطرنشان کرده است که Mellum ممکن است «تعصبات موجود در پایگاه‌های کد عمومی را منعکس کند» و پیشنهادات کد آن الزاماً «ایمن یا بدون آسیب‌پذیری نخواهند بود.»

JetBrains در یک پست وبلاگی نوشت: «این تنها آغاز راه است. ما به دنبال عمومی‌سازی نیستیم، بلکه بر روی کانون‌سازی تمرکز داریم. اگر Mellum حتی یک آزمایش، مشارکت یا همکاری معنادار را ایجاد کند، ما آن را یک موفقیت می‌دانیم.»

چت با هوش مصنوعی

دیدگاه‌ خود را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

اسکرول به بالا