اوپن‌ای‌آی: مرورگرهای هوش‌مصنوعی همواره در معرض حملات تزریق دستور (Prompt Injection) خواهند بود

عنوان: اوپن‌ای‌آی: «تزریق پرامپت» تهدیدی پایدار برای مرورگر عامل‌محور ChatGPT Atlas — راهکارها و محدودیت‌ها

اوپن‌ای‌آی در حالی که به‌طور پیوسته امنیت مرورگر عامل‌محور خود، ChatGPT Atlas، را تقویت می‌کند، صراحتاً هشدار می‌دهد که حملات نوع «تزریق پرامپت» (prompt injection) تهدیدی پایدار و بعید است به‌طور کامل ریشه‌کنی شود. این مسأله پرسش‌های مهمی درباره امکان‌پذیری عملکرد امن عامل‌های هوش مصنوعی در فضای باز وب ایجاد کرده است.

چرا تزریق پرامپت خطرناک است؟
تزریق پرامپت نوعی حمله است که در آن محتوای مخرب — معمولاً در صفحات وب، اسناد یا ایمیل‌ها — طوری طراحی می‌شود که عامل هوش مصنوعی آن را به‌عنوان دستور معتبر تفسیر کرده و رفتار ناخواسته‌ای انجام دهد. این حملات می‌توانند از استخراج اطلاعات حساس تا اجرای فرم‌های پیچیده و طولانی از دستورات مضر را شامل شوند. برخلاف حملات سنتی، این روش مستقیماً لایه‌های زبانی و تصمیم‌گیری مدل را هدف قرار می‌دهد و به همین دلیل دشوارتر برای شناسایی و پیشگیری است.

آنچه اوپن‌ای‌آی اعلام کرده
در پست رسمی خود، اوپن‌ای‌آی اذعان کرده که فعال‌سازی «حالت عامل» (agent mode) در Atlas سطح تهدید امنیتی را افزایش می‌دهد. از زمان عرضه Atlas در اکتبر، پژوهشگران امنیتی نشان داده‌اند که با چند کلمه در یک سند آنلاین می‌توان رفتار مرورگر را تغییر داد. شرکت‌های دیگر مانند Brave و Perplexity نیز نسبت به چالش‌های سیستماتیک ناشی از تزریق غیرمستقیم (indirect prompt injection) هشدار داده‌اند. افزون بر این، مرکز ملی امنیت سایبری بریتانیا (NCSC) اعلام کرده که ممکن است این نوع حملات هرگز به‌طور کامل مهار نشوند و توصیه کرده است که امور به سمت کاهش ریسک و اثرات آن سوق داده شود، نه انتظار برای حذف کامل تهدید.

استراتژی اوپن‌ای‌آی: مهاجم خودکار مبتنی بر LLM
اوپن‌ای‌آی برای شناسایی و خنثی‌سازی نقاط ضعف از یک «مهاجم خودکار مبتنی بر مدل زبانی بزرگ» استفاده می‌کند که با یادگیری تقویتی آموزش دیده است. این مهاجم شبیه‌سازی‌ها اجرا می‌کند تا راهکارهای حمله را آزمون و خطا کند: ابتدا در محیط شبیه‌ساز حمله را اجرا می‌کند، سپس واکنش عامل هدف را تحلیل کرده، حمله را تصحیح و دوباره امتحان می‌کند. در نتیجه، این فرایند می‌تواند استراتژی‌های حمله‌ای را کشف کند که در تست‌های انسانی یا گزارش‌های خارجی دیده نشده‌اند. اوپن‌ای‌آی می‌گوید این چرخه پاسخ سریع (rapid-response) وعده‌هایی برای کشف زودهنگام روش‌های نوآورانه حمله پیش از بهره‌برداری واقعی دارد.

نمونه عملی و محدودیت‌ها
اوپن‌ای‌آی در یکی از دموها نشان داد که مهاجم خودکار چگونه با قرار دادن یک ایمیل مخرب در صندوق ورودی کاربر، عامل را به ارسال پیام استعفا به‌جای تهیه پاسخ خودکار خارج از دفتر وادار کرده است. با به‌روزرسانی‌های امنیتی، هم‌اکنون حالت عامل توانسته چنین تلاش‌های تزریق را شناسایی و به کاربر اطلاع دهد؛ اما شرکت اعتراف می‌کند که جلوگیری کامل از همه تزریق‌ها به‌صورت صفر-خطا عملی نیست. سخنگوی اوپن‌ای‌آی از ارائه آمار دقیق درباره کاهش موفقیت‌ آمیز حملات پس از به‌روزرسانی‌ها خودداری کرد، اما تأکید کرد که همکاری با اشخاص ثالث و آزمون‌های گسترده پیش از عرضه ادامه داشته است.

توصیه‌ها برای کاهش خطر کاربران و سازمان‌ها
پژوهشگران امنیتی و خود اوپن‌ای‌آی پیشنهادهایی عملی برای کاهش ریسک ارائه می‌دهند:
– محدود کردن دسترسی عامل به حساب‌های لاگین‌شده و داده‌های حساس (مثلاً ایمیل و اطلاعات پرداخت).
– الزام به تأیید کاربر برای اقدامات حساس مانند ارسال پیام یا انجام تراکنش.
– ارائه وظایف مشخص به عامل به‌جای اجازه «هر اقدام لازم را انجام بده» تا فضای عمل عامل محدودتر و کمتر در معرض نفوذ محتواهای پنهان قرار گیرد.
– اعمال لایه‌ای از دفاع‌ها: سیاست‌های سطح معماری، تست مداوم و قرنطینه‌سازی ورودی‌های مشکوک.

دیدگاه کارشناسان
رامی مک‌کارتی، پژوهشگر ارشد امنیت در شرکت Wiz، تأکید می‌کند که یادگیری تقویتی می‌تواند به‌صورت مداوم با رفتار مهاجم سازگار شود اما تنها بخشی از راه‌حل است. او می‌گوید «معیار سنجش ریسک در سیستم‌های هوش مصنوعی حاصل ضرب خودمختاری در میزان دسترسی است»؛ مرورگرهای عامل‌محور معمولاً خودمختاری متوسط اما دسترسی بسیار بالا دارند که آن‌ها را در معرض تهدیدات حساس قرار می‌دهد. به‌عقیده او، تا وقتی ارزش کاربردهای روزمره این مرورگرها به‌طور قاطع از ریسک‌هایشان پیشی نگیرد، توجیه استفاده گسترده از آن‌ها دشوار خواهد بود.

جمع‌بندی
تزریق پرامپت یک چالش بلندمدت امنیتی برای عامل‌های هوش مصنوعی است و به‌نظر نمی‌رسد به‌زودی ناپدید شود. رویکردهای فعلی شامل آزمون‌های مقیاس‌پذیر، مهاجم‌های خودکار برای کشف نقاط ضعف و سیاست‌های محدودکننده دسترسی است. کاربران و سازمان‌ها باید با احتیاط عمل کنند، دسترسی‌ها را محدود کنند و همواره از تأییدات انسانی برای اقدام‌های حساس بهره ببرند تا تعادل میان سودمندی عامل‌های هوش مصنوعی و ریسک‌های امنیتی حفظ شود.

تبدیل متن‌ به صوت

اوپن‌ای‌آی: مرورگرهای هوش‌مصنوعی همواره در معرض حملات تزریق دستور (Prompt Injection) خواهند بود

دیدگاه‌ خود را بنویسید لغو پاسخ