رویکرد جدید به‌سوی اطمینان‌پذیری عوامل: AgentSpec، عوامل را ملزم به رعایت قوانین می‌کند

معرفی AgentSpec: راهکاری نوین برای افزایش ایمنی و قابلیت اطمینان در عوامل هوش مصنوعی

با رشد روزافزون کاربرد هوش مصنوعی در صنایع مختلف، مسئله ایمنی و قابلیت اطمینان عوامل هوش مصنوعی به یکی از چالش‌های عمده تبدیل شده است. عوامل هوش مصنوعی یا AI agents می‌توانند فرآیندهای کاری را خودکار کنند و بهره‌وری را افزایش دهند، اما در برخی مواقع ممکن است اقدامات ناخواسته‌ای انجام دهند یا از مسیر تعیین‌شده خارج شوند. این مشکلات نگرانی‌های زیادی در میان سازمان‌ها به وجود آورده‌اند، زیرا وجود عوامل غیرقابل‌اعتماد می‌تواند باعث بروز آسیب‌ها و اختلالات جدی شود. اما اکنون محققان دانشگاه مدیریت سنگاپور (SMU) با ارائه راهکاری جدید به نام AgentSpec به دنبال رفع این چالش هستند.

AgentSpec چیست؟

AgentSpec یک چارچوب مخصوص دامنه است که به کاربران اجازه می‌دهد قوانین ساختاری تعریف کنند. این قوانین شامل سه عنصر اصلی Triggers (محرک‌ها)، Predicates (شرط‌ها) و Enforcement Mechanisms (مکانیزم‌های اجرای قوانین) هستند. بر اساس این چارچوب، عوامل هوش مصنوعی تنها در محدوده‌ای که کاربران تعیین کرده‌اند فعالیت می‌کنند. برخلاف مدل‌های زبان بزرگ (LLM)، AgentSpec یک مدل جدید نیست بلکه رویکردی است که به منظور هدایت عوامل هوش مصنوعی بر اساس LLM طراحی شده است.

اهمیت AgentSpec در محیط‌های سازمانی و خودران

محققان باور دارند که AgentSpec می‌تواند در محیط‌های سازمانی، به‌ویژه در برنامه‌های کاربردی مثل خودروهای خودران، به طور مؤثر استفاده شود. این چارچوب از اجرای اقدامات خطرناک یا غیرایمن جلوگیری می‌کند و عملکرد آن با سربار پردازشی در حد میلی‌ثانیه همراه است.

بررسی‌های اولیه نشان داده‌اند که AgentSpec توانسته است بیش از ۹۰ درصد از اجرای کدهای ناایمن جلوگیری کند، ضمن اینکه قوانین مرتبط با نقض قانون در سناریوهای رانندگی خودران را به طور کامل رعایت کند. همچنین این سیستم توانست اقدامات خطرناک را در وظایف عوامل هوش مصنوعی تجسمی حذف کند. نتایج تست‌هایی که بر اساس قوانین LLM تولید شده توسط OpenAI انجام گرفته‌اند نیز نشان‌دهنده موفقیت چشم‌گیر AgentSpec بوده‌اند؛ بیش از ۸۷ درصد از کدهای ریسکی تحت کنترل قرار گرفته‌اند و در ۵ مورد از ۸ سناریوی بررسی‌شده از نقض قوانین جلوگیری شده است.

تفاوت‌های کلیدی AgentSpec با سایر روش‌ها

در حال حاضر چندین روش برای بهبود کنترل و قابلیت اطمینان عوامل هوش مصنوعی توسعه یافته‌اند، از جمله ToolEmu، GuardAgent و Agentic Evaluations که توسط استارتاپ Galileo ارائه شده‌اند. علاوه بر این، پلتفرم اپن سورس H2O.ai از مدل‌های پیش‌بینی‌کننده برای افزایش دقت عوامل در صنایع مختلف از جمله مالی، بهداشت و درمان، مخابرات و دولت استفاده می‌کند.

با این حال، محققان معتقدند که روش‌های فعلی مانند ToolEmu علی‌رغم شناسایی خطرات، فاقد قابلیت تفسیرپذیری بوده و مکانیزم قابل قبولی برای اجرای قوانین ایمنی ارائه نمی‌دهند. این ضعف‌ها باعث می‌شود این روش‌ها در مقابل حملات احتمالی آسیب‌پذیر باشند. برخلاف این رویکردها، AgentSpec به عنوان یک لایه اجرایی زمان اجرا عمل می‌کند و رفتار عامل را هنگام اجرای وظایف تحت کنترل قرار می‌دهد.

مکانیسم عملکرد AgentSpec

AgentSpec به کاربران این امکان را می‌دهد تا قوانینی را تعریف کنند که رفتار عوامل هوش مصنوعی را در سه مرحله کلیدی کنترل می‌کنند:
1. پیش از اجرای یک اقدام (AgentAction): بررسی محدودیت‌های تعیین‌شده برای جلوگیری از دستورهای ناایمن.
2. پس از ایجاد یک مشاهده توسط عامل (AgentStep): تحلیل نتایج برای اطمینان از صحت عملکرد.
3. در زمان تکمیل وظیفه عامل (AgentFinish): ارزیابی نهایی عملکرد عامل بر اساس قوانین تعریف‌شده.

AgentSpec بدون تغییر در منطق اصلی عامل، قوانین ایمنی را با استفاده از این نقاط تصمیم‌گیری به جریان کاری عوامل اضافه می‌کند.

آینده هوش مصنوعی و ضرورت توسعه ابزارهای ایمن

با گسترش عوامل هوش مصنوعی که می‌توانند به طور مستقل وظایف کاربران را انجام دهند، مفهوم “عوامل محیطی” یا ambient agents بیش از پیش اهمیت پیدا خواهد کرد. این عوامل، به صورت خودکار و پیوسته در پس‌زمینه اجرا می‌شوند و اقدامات لازم را بدون دخالت مستقیم کاربر انجام می‌دهند. اما برای دستیابی به این چشم‌انداز، نیاز به ابزارهایی مانند AgentSpec که مانع از تصمیم‌گیری‌ها و اقدامات غیرایمن می‌شوند ضروری است. با رشد تقاضا برای این نوع عوامل هوشمند، می‌توان انتظار داشت که روش‌هایی مشابه AgentSpec به صورت گسترده توسعه یابند.

اگر علاقه‌مند به اخبار حوزه هوش مصنوعی هستید، سایت بینا ویرا به عنوان مرجع تخصصی مطالب علمی و فناوری، جدیدترین اطلاعات و تحولات مرتبط را ارائه می‌دهد. برای اطلاعات بیشتر درباره ابزارهای نوین و کاربردهای عملی هوش مصنوعی، به بخش اخبار ما مراجعه کنید.

چت با هوش مصنوعی