عنوان: GEA از UCSB؛ چارچوبی گروهمحور که عاملهای هوش مصنوعی را خودتکاملی و خودترمیم میکند
محققان دانشگاه کالیفرنیا، سانتا باربارا (UCSB) چارچوب جدیدی به نام Group-Evolving Agents (GEA) معرفی کردهاند که بهجای تکامل فردی عاملها، تکامل را یک واحد گروهی میداند. این رویکرد نوین میتواند یکی از موانع اصلی بهکارگیری عاملهای هوش مصنوعی در سازمانها — نیاز مداوم به دخالت مهندس انسانی برای رفع شکستها پس از تغییرات ساده در کتابخانهها یا گردشکارها — را کاهش دهد.
چالش فعلی: ایستایی معماریها و تأثیر آن بر استقرار در سازمانها
بسیاری از سامانههای عاملمحور کنونی بر معماریهای ثابت طراحیشده توسط مهندسان تکیه دارند و وقتی محیط کاری پویا یا مسئلهای جدید پیش میآید، قادر به فراتر رفتن از محدودیتهای طراحی اولیه نیستند. رویکردهای پیشین برای خود-تکاملی معمولاً از الگوهای الهامگرفته از تکامل زیستی پیروی میکنند که تکامل را بهصورت فرایند «فرد-محور» و در قالب درختهای تبارزایی مجزا مدل میکنند. این ساختار منجر به ایزوله شدن شاخهها و از بین رفتن نوآوریهایی میشود که در یک شاخه کشف شده اما در شاخههای دیگر قابل دسترسی نیستند.
راهکار GEA: تکامل گروهی و اشتراک تجربیات
GEA پارادایم را تغییر میدهد و گروهی از عاملها را واحد اساسی تکامل قرار میدهد. فرآیند کلی به این صورت است:
– انتخاب گروه والد: از آرشیوی از عاملها، گروهی بر اساس ترکیبی از عملکرد (توان حل مسئله) و نوآوری (تمایز قابلیتها) انتخاب میشوند تا تعادل بین ثبات و خلاقیت حفظ شود.
– آرشیو تجربه مشترک: بهجای اینکه هر فرزند تنها از والد مستقیم خود بیاموزد، همه آثار تکاملی اعضای گروه — شامل تغییرات کد، راهحلهای موفق و تاریخچه فراخوانی ابزارها — در یک مخزن تجربی مشترک قرار میگیرد.
– ماژول بازتاب (Reflection Module): یک مدل زبانی بزرگ، این تاریخچه جمعی را تحلیل میکند تا الگوهای گروهی را استخراج و «دستورات تکاملی» سطح بالا تولید کند. این دستورات هدایتگر تولید نسل بعدی هستند تا نقاط قوت همه والدها را ترکیب کنند، نه صرفاً خصوصیات یک تبار.
– بهروزرسانی خودکار: بر مبنای تحلیلهای بازتاب، عاملها قادر به اصلاح ساختار و کد خود برای بهرهگیری از راهکارهای کشفشده میشوند.
آزمونها و نتایج کلیدی
محققان GEA را در برابر مرجع فعلی خود-تکاملی (Darwin Godel Machine یا DGM) در دو معیار سختگیرانه آزمایش کردند:
– SWE-bench Verified (مسائل واقعی GitHub شامل باگ و درخواست ویژگی): GEA به موفقیت 71.0% رسید در مقابل 56.7% برای پایه، که نشاندهنده افزایش چشمگیر توانمندی در نگهداری و اصلاح نرمافزار است.
– Polyglot (تولید کد در زبانهای برنامهنویسی مختلف): GEA با 88.3% در برابر 68.3% برای پایه نشان داد که بهخوبی با پشتههای فناوری متنوع سازگار است.
– خودترمیم و مقاومت: با وارد کردن باگهای دستی در پیادهسازیها، GEA توانست میانگین تعمیر را در 1.4 تکرار انجام دهد درحالیکه پایه به حدود 5 تکرار نیاز داشت.
– ترکیب نوآوریها: عامل برتر در GEA ویژگیهایی از 17 جد منحصربهفرد (معادل 28% از جمعیت) را ادغام کرد، درحالیکه بهترین عامل در پایه تنها 9 جد را ترکیب نمود.
مقایسه با راهکارهای انسانی و پیامدهای سازمانی
در برخی بنچمارکها، عاملهای تکاملیافته با GEA عملکردی برابر یا بهتر از چارچوبهای طراحیشده توسط انسان داشتند: در SWE-bench عملکرد GEA با OpenHands (چارچوب اوپنسورس طراحیشده توسط انسان) برابری کرد و در Polyglot از Aider (دستیار کدنویسی محبوب) پیشی گرفت (Aider حدود 52.0%). این یافته نشان میدهد سازمانها ممکن است در آینده کمتر به تیمهای بزرگ مهندسی پرامپت یا تنظیم دستی چارچوبها وابسته باشند، زیرا عاملها میتوانند بهصورت متا-یادگیرانه بهینهسازیها را فراگیرند.
هزینه، استقرار و تطبیقپذیری مدل
محققان تأکید میکنند که GEA یک سیستم دومرحلهای است: (1) تکامل عاملها و (2) استنتاج/استقرار. پس از فرایند تکامل، یک عامل تکاملیافته برای استنتاج به کار گرفته میشود؛ بنابراین هزینه استنتاج سازمانها تقریباً مشابه یک سیستم تکعامله استاندارد باقی میماند. همچنین، بهطور مهمی، بهینهسازیهای کشفشده توسط GEA مستقل از مدل زیربنایی بودند: عاملهایی که با یک خانواده مدل (مثلاً Claude) تکامل یافتهاند، پس از جابهجایی به موتور دیگری (مثلاً GPT-5.1 یا GPT-o3-mini) همچنان کارایی حفظ کردند که امکان تعویض ارائهدهندگان مدل را برای سازمانها فراهم میسازد.
محدودیتها و نکات احتیاطی
محققان هشدار میدهند که رویکرد «ذهنجمعی» GEA در حوزههای کمتر عینی (مثل تولید خلاقانه) ممکن است با نویز و تجربیات کمکیفیت مواجه شود؛ بنابراین فیلترهای قویتر برای انتخاب تجربیات لازم است. برای محیطهای حساس و مقرراتی نیز تاکید شده که استقرارهای سازمانی باید شامل ضوابط غیرقابل تکامل (مانند اجرای sandboxed، محدودیتهای سیاستی و لایههای تأیید) باشند تا ریسکهای مربوط به اصلاح خودکار کد مدیریت شود.
برای توسعهدهندگان: اجزای لازم جهت پیادهسازی مفهومی
محققان اشاره کردهاند که توسعهدهندگان میتوانند مفاهیم GEA را روی فریمورکهای عامل موجود پیادهسازی کنند؛ سه جزء کلیدی عبارتاند از:
– آرشیو تجربه (experience archive) برای ذخیره آثار تکاملی؛
– ماژول بازتاب (reflection module) برای تحلیل الگوهای گروهی؛
– ماژول بهروزرسانی (updating module) برای اعمال اصلاحات خودکار بر کد و ساختار عاملها.
چشمانداز
GEA مسیر جدیدی برای توسعه عاملهای خودبهبود و خودترمیم در محیطهای پیچیده و متغیر باز میکند و میتواند جریان کار R&D سازمانها را متحول سازد—از جمعآوری تجربیات اولیه توسط مدلهای کوچکتر تا هدایت تکامل توسط مدلهای قویتر. انتشار رسمی کد از سوی تیم پژوهشی در آینده نزدیک برنامهریزی شده و میتواند مبنایی برای توسعه کاربردیتر و امنتر عاملهای تکاملیافته در صنعت باشد.
