چارچوب عامل جدید؛ عملکردی برابر با سیستم‌های مهندسی‌شده انسانی و هزینه استنتاج صفر

عنوان: GEA از UCSB؛ چارچوبی گروه‌محور که عامل‌های هوش مصنوعی را خودتکاملی و خودترمیم می‌کند

محققان دانشگاه کالیفرنیا، سانتا باربارا (UCSB) چارچوب جدیدی به نام Group-Evolving Agents (GEA) معرفی کرده‌اند که به‌جای تکامل فردی عامل‌ها، تکامل را یک واحد گروهی می‌داند. این رویکرد نوین می‌تواند یکی از موانع اصلی به‌کارگیری عامل‌های هوش مصنوعی در سازمان‌ها — نیاز مداوم به دخالت مهندس انسانی برای رفع شکست‌ها پس از تغییرات ساده در کتابخانه‌ها یا گردش‌کارها — را کاهش دهد.

چالش فعلی: ایستایی معماری‌ها و تأثیر آن بر استقرار در سازمان‌ها
بسیاری از سامانه‌های عامل‌محور کنونی بر معماری‌های ثابت طراحی‌شده توسط مهندسان تکیه دارند و وقتی محیط کاری پویا یا مسئله‌ای جدید پیش می‌آید، قادر به فراتر رفتن از محدودیت‌های طراحی اولیه نیستند. رویکردهای پیشین برای خود-تکاملی معمولاً از الگوهای الهام‌گرفته از تکامل زیستی پیروی می‌کنند که تکامل را به‌صورت فرایند «فرد-محور» و در قالب درخت‌های تبارزایی مجزا مدل می‌کنند. این ساختار منجر به ایزوله شدن شاخه‌ها و از بین رفتن نوآوری‌هایی می‌شود که در یک شاخه کشف شده اما در شاخه‌های دیگر قابل دسترسی نیستند.

راهکار GEA: تکامل گروهی و اشتراک تجربیات
GEA پارادایم را تغییر می‌دهد و گروهی از عامل‌ها را واحد اساسی تکامل قرار می‌دهد. فرآیند کلی به این صورت است:
– انتخاب گروه والد: از آرشیوی از عامل‌ها، گروهی بر اساس ترکیبی از عملکرد (توان حل مسئله) و نوآوری (تمایز قابلیت‌ها) انتخاب می‌شوند تا تعادل بین ثبات و خلاقیت حفظ شود.
– آرشیو تجربه مشترک: به‌جای اینکه هر فرزند تنها از والد مستقیم خود بیاموزد، همه آثار تکاملی اعضای گروه — شامل تغییرات کد، راه‌حل‌های موفق و تاریخچه فراخوانی ابزارها — در یک مخزن تجربی مشترک قرار می‌گیرد.
– ماژول بازتاب (Reflection Module): یک مدل زبانی بزرگ، این تاریخچه جمعی را تحلیل می‌کند تا الگوهای گروهی را استخراج و «دستورات تکاملی» سطح بالا تولید کند. این دستورات هدایت‌گر تولید نسل بعدی هستند تا نقاط قوت همه والدها را ترکیب کنند، نه صرفاً خصوصیات یک تبار.
– به‌روزرسانی خودکار: بر مبنای تحلیل‌های بازتاب، عامل‌ها قادر به اصلاح ساختار و کد خود برای بهره‌گیری از راهکارهای کشف‌شده می‌شوند.

آزمون‌ها و نتایج کلیدی
محققان GEA را در برابر مرجع فعلی خود-تکاملی (Darwin Godel Machine یا DGM) در دو معیار سخت‌گیرانه آزمایش کردند:
– SWE-bench Verified (مسائل واقعی GitHub شامل باگ و درخواست ویژگی): GEA به موفقیت 71.0% رسید در مقابل 56.7% برای پایه، که نشان‌دهنده افزایش چشمگیر توانمندی در نگهداری و اصلاح نرم‌افزار است.
– Polyglot (تولید کد در زبان‌های برنامه‌نویسی مختلف): GEA با 88.3% در برابر 68.3% برای پایه نشان داد که به‌خوبی با پشته‌های فناوری متنوع سازگار است.
– خودترمیم و مقاومت: با وارد کردن باگ‌های دستی در پیاده‌سازی‌ها، GEA توانست میانگین تعمیر را در 1.4 تکرار انجام دهد درحالی‌که پایه به حدود 5 تکرار نیاز داشت.
– ترکیب نوآوری‌ها: عامل برتر در GEA ویژگی‌هایی از 17 جد منحصربه‌فرد (معادل 28% از جمعیت) را ادغام کرد، درحالی‌که بهترین عامل در پایه تنها 9 جد را ترکیب نمود.

مقایسه با راهکارهای انسانی و پیامدهای سازمانی
در برخی بنچمارک‌ها، عامل‌های تکامل‌یافته با GEA عملکردی برابر یا بهتر از چارچوب‌های طراحی‌شده توسط انسان داشتند: در SWE-bench عملکرد GEA با OpenHands (چارچوب اوپن‌سورس طراحی‌شده توسط انسان) برابری کرد و در Polyglot از Aider (دستیار کدنویسی محبوب) پیشی گرفت (Aider حدود 52.0%). این یافته نشان می‌دهد سازمان‌ها ممکن است در آینده کمتر به تیم‌های بزرگ مهندسی پرامپت یا تنظیم دستی چارچوب‌ها وابسته باشند، زیرا عامل‌ها می‌توانند به‌صورت متا-یادگیرانه بهینه‌سازی‌ها را فراگیرند.

هزینه، استقرار و تطبیق‌پذیری مدل
محققان تأکید می‌کنند که GEA یک سیستم دومرحله‌ای است: (1) تکامل عامل‌ها و (2) استنتاج/استقرار. پس از فرایند تکامل، یک عامل تکامل‌یافته برای استنتاج به کار گرفته می‌شود؛ بنابراین هزینه استنتاج سازمان‌ها تقریباً مشابه یک سیستم تک‌عامله استاندارد باقی می‌ماند. همچنین، به‌طور مهمی، بهینه‌سازی‌های کشف‌شده توسط GEA مستقل از مدل زیربنایی بودند: عامل‌هایی که با یک خانواده مدل (مثلاً Claude) تکامل یافته‌اند، پس از جابه‌جایی به موتور دیگری (مثلاً GPT-5.1 یا GPT-o3-mini) همچنان کارایی حفظ کردند که امکان تعویض ارائه‌دهندگان مدل را برای سازمان‌ها فراهم می‌سازد.

محدودیت‌ها و نکات احتیاطی
محققان هشدار می‌دهند که رویکرد «ذهن‌جمعی» GEA در حوزه‌های کمتر عینی (مثل تولید خلاقانه) ممکن است با نویز و تجربیات کم‌کیفیت مواجه شود؛ بنابراین فیلترهای قوی‌تر برای انتخاب تجربیات لازم است. برای محیط‌های حساس و مقرراتی نیز تاکید شده که استقرارهای سازمانی باید شامل ضوابط غیرقابل تکامل (مانند اجرای sandboxed، محدودیت‌های سیاستی و لایه‌های تأیید) باشند تا ریسک‌های مربوط به اصلاح خودکار کد مدیریت شود.

برای توسعه‌دهندگان: اجزای لازم جهت پیاده‌سازی مفهومی
محققان اشاره کرده‌اند که توسعه‌دهندگان می‌توانند مفاهیم GEA را روی فریم‌ورک‌های عامل موجود پیاده‌سازی کنند؛ سه جزء کلیدی عبارت‌اند از:
– آرشیو تجربه (experience archive) برای ذخیره آثار تکاملی؛
– ماژول بازتاب (reflection module) برای تحلیل الگوهای گروهی؛
– ماژول به‌روزرسانی (updating module) برای اعمال اصلاحات خودکار بر کد و ساختار عامل‌ها.

چشم‌انداز
GEA مسیر جدیدی برای توسعه عامل‌های خودبهبود و خودترمیم در محیط‌های پیچیده و متغیر باز می‌کند و می‌تواند جریان کار R&D سازمان‌ها را متحول سازد—از جمع‌آوری تجربیات اولیه توسط مدل‌های کوچک‌تر تا هدایت تکامل توسط مدل‌های قوی‌تر. انتشار رسمی کد از سوی تیم پژوهشی در آینده نزدیک برنامه‌ریزی شده و می‌تواند مبنایی برای توسعه کاربردی‌تر و امن‌تر عامل‌های تکامل‌یافته در صنعت باشد.

چت با هوش مصنوعی

چارچوب عامل جدید؛ عملکردی برابر با سیستم‌های مهندسی‌شده انسانی و هزینه استنتاج صفر

دیدگاه‌ خود را بنویسید لغو پاسخ