ابزارهای کدنویسی هوش مصنوعی ممکن است سرعت همه توسعه‌دهندگان را افزایش ندهند، مطالعه نشان می‌دهد

تحول چشمگیر در فرآیندهای کاری مهندسان نرم‌افزار با ورود ابزارهای کدنویسی مبتنی بر هوش مصنوعی، نظیر Cursor و GitHub Copilot، در سال‌های اخیر به وقوع پیوسته است. این ابزارها وعده افزایش بهره‌وری را با خود به همراه دارند و به طور خودکار کدها را می‌نویسند، اشکالات را اصلاح می‌کنند و تغییرات را آزمایش می‌کنند. این تکنولوژی‌ها بر پایه مدل‌های هوش مصنوعی developed by OpenAI، Google DeepMind، Anthropic و xAI کار می‌کنند که در سال‌های اخیر در آزمون‌های متعدد مهندسی نرم‌افزار به طرز چشمگیری عملکرد خود را بهبود بخشیده‌اند.

اما یک مطالعه جدید که روز پنجشنبه توسط گروه تحقیقاتی غیرانتفاعی METR منتشر شده، سوالاتی را در مورد این موضوع مطرح می‌کند که آیا ابزارهای کدنویسی هوش مصنوعی واقعاً توانایی افزایش بهره‌وری توسعه‌دهندگان با تجربه را دارند یا خیر. گروه METR با دعوت از 16 توسعه‌دهنده تجربی در حوزه نرم‌افزار آزاد، یک آزمایش کنترل‌شده تصادفی انجام داد که شامل انجام 246 کار واقعی در مخازن کد بزرگ بود که این توسعه‌دهندگان به‌طور منظم در آن‌ها مشارکت داشتند. در این تحقیق، تقریباً نیمی از کارها تحت عنوان “اجازه استفاده از AI” به توسعه‌دهندگان اختصاص داده شد، به طوری که آن‌ها مجاز به استفاده از ابزارهای کدنویسی پیشرفته‌ای مانند Cursor Pro بودند، در حالی که در نیمه دیگر اجازه استفاده از این ابزارها داده نشد.

قبل از انجام کارهای محول شده، توسعه‌دهندگان پیش‌بینی کردند که استفاده از ابزارهای کدنویسی هوش مصنوعی زمان انجام کار را 24 درصد کاهش خواهد داد. اما نتایج به گونه‌ای دیگر بود. بر اساس اظهارات محققان، “به طرز قابل توجهی متوجه شدیم که اجازه دادن به AI واقعاً زمان تکمیل کار را 19 درصد افزایش می‌دهد— توسعه‌دهندگان در استفاده از ابزارهای هوش مصنوعی کندتر عمل می‌کنند.” از بین توسعه‌دهندگانی که در این مطالعه شرکت کردند، تنها 56 درصد تجربه استفاده از Cursor را داشتند. اگرچه تقریباً همه آن‌ها (94 درصد) تجربه استفاده از مدل‌های زبانی وب‌محور را در فرآیندهای کدنویسی خود داشتند، اما این مطالعه اولین باری بود که برخی از آن‌ها از Cursor به‌طور خاص استفاده کردند. همچنین، پژوهشگران خاطرنشان کردند که توسعه‌دهندگان قبل از انجام آزمایش‌ها، آموزش لازم برای استفاده از Cursor را دیده بودند.

با این حال، یافته‌های METR سؤالاتی را در مورد افزایش بهره‌وری مورد انتظار از ابزارهای کدنویسی هوش مصنوعی در سال 2025 پیش می‌آورد. بر اساس این تحقیق، توسعه‌دهندگان نباید فرض کنند که ابزارهای کدنویسی هوش مصنوعی— به‌ویژه آنچه که به عنوان “کدنویس‌های احساسی” شناخته می‌شود— به‌طور فوری کارایی آن‌ها را افزایش می‌دهد. پژوهشگران METR به چندین دلیل ممکن اشاره می‌کنند که چرا استفاده از AI باعث کندی توسعه‌دهندگان به جای افزایش سرعت آن‌ها شده است. نخست، توسعه‌دهندگان زمان بیشتری را صرف دادن دستورات به AI و انتظار برای دریافت پاسخ می‌کنند تا اینکه واقعاً به کدنویسی بپردازند. همچنین، هوش مصنوعی در کدهای بزرگ و پیچیده معمولاً دچار مشکلاتی می‌شود که در این آزمایش نیز مورد استفاده قرار گرفت. نویسندگان این مطالعه از بیان هرگونه نتیجه‌گیری قوی از این یافته‌ها ابا دارند و صریحاً اعلام می‌کنند که باور ندارند سیستم‌های هوش مصنوعی در حال حاضر توانایی سرعت بخشیدن به کار بیشتر توسعه‌دهندگان نرم‌افزار را ندارند.

مطالعات بزرگ‌تری نیز نشان داده‌اند که ابزارهای کدنویسی هوش مصنوعی واقعاً می‌توانند به تسریع فرآیندهای کاری مهندسان نرم‌افزار کمک کنند. نویسندگان همچنین بر این نکته تاکید می‌کنند که پیشرفت‌های هوش مصنوعی در سال‌های اخیر قابل توجه بوده و آن‌ها انتظار ندارند که نتایج مشابهی حتی سه ماه دیگر به دست آید. METR همچنین مشاهده کرده است که ابزارهای کدنویسی هوش مصنوعی قادرند توانایی خود را در انجام وظایف پیچیده و طولانی بهبود بخشند. با این حال، این تحقیق دلیل دیگری برای ابراز تردید نسبت به دستاوردهای وعده داده شده ابزارهای کدنویسی هوش مصنوعی ارائه می‌دهد، چرا که سایر مطالعات نشان داده‌اند که این ابزارها ممکن است خطاهایی را معرفی کنند و در برخی موارد، آسیب‌پذیری‌های امنیتی ایجاد کنند.

ایجاد متن‌های دقیق از فایل‌های صوتی شما

ابزارهای کدنویسی هوش مصنوعی ممکن است سرعت همه توسعه‌دهندگان را افزایش ندهند، مطالعه نشان می‌دهد

دیدگاه‌ خود را بنویسید لغو پاسخ