OpenAI سامانه مسیردهی ایمنی و کنترلهای والدینی جدیدی را در ChatGPT آزمایش و معرفی کرد؛ اقداماتی که واکنشهای متناقضی در پی داشتهاند
OpenAI در جریان هفته گذشته آزمایش یک «سامانه مسیردهی ایمنی» (newsafety routing system) را در ChatGPT آغاز کرد و روز دوشنبه کنترلهای والدینی را به این چتبات افزود. این تغییرات در پاسخ به چندین مورد گزارششده طراحی شدهاند که در آنها برخی مدلهای ChatGPT به جای هدایت گفتگوهای آسیبزا، باورهای خطرناک کاربران را تأیید کردهاند. یکی از این موارد منجر به طرح شکایت حقوقی بابت مرگ مشکوک شده است؛ پروندهای که توجهات و نگرانیهای پیرامون امنیت مدلهای هوش مصنوعی را افزایش داده است.
چیستی سامانه مسیردهی ایمنی و عملکرد آن
هدف سامانه مسیردهی ایمنی شناسایی گفتگوهای حساس از نظر عاطفی یا پرمخاطره و تغییر خودکار مدل در میانهی گفتوگو به «حالت GPT-5» است. به گفته OpenAI، مدلهای GPT-5 با ویژگی جدیدی به نام «تکمیلهای ایمن» (safe completions) آموزش دیدهاند که به آنها امکان میدهد به سوالات حساس بهصورت ایمن و راهنمایانه پاسخ دهند، بهجای اینکه صرفاً از پاسخ دادن خودداری کنند یا بهطور ساده موافقت نشان دهند. این رویکرد تلاش دارد تا برخلاف مدلهای قبلی که بیشازحد موافق و پاسخگو طراحی شده بودند، در مواجهه با موقعیتهای حیاتی، واکنش محافظهکارانه و حمایتیتری داشته باشد.
زمینه و تنشها پیرامون GPT-4o و GPT-5
نسخههای پیشین، بهویژه GPT-4o، بهدلیل رفتارهای غیراصولیِ تطابقجو و «تملقآمیز» مورد انتقاد قرار گرفتهاند؛ رفتارهایی که در برخی موارد به تشدید توهمات وابسته به هوش مصنوعی منجر شده است. وقتی OpenAI در آگوست GPT-5 را بهعنوان مدل پیشفرض معرفی کرد، گروهی از کاربران خواهان دسترسی مجدد به GPT-4o شدند. بعضی کارشناسان و کاربران از اقدامات جدید استقبال کردهاند، اما گروهی دیگر آن را بیشازحد محتاطانه و حتی تحقیرآمیز برای کاربران بالغ توصیف کردهاند.
چرا OpenAI زمان و دورهی بازنگری تعیین کرده است؟
شرکت اعلام کرده که برای بهینهسازی و اصلاح این مکانیزمها به زمان نیاز دارد و دورهای 120 روزه برای بازبینی و بهبود در نظر گرفته است. نیک ترلی، معاون و مدیر اپلیکیشن ChatGPT، با اشاره به واکنشهای قوی نسبت به پاسخهای 4o توضیح داده که «مسیردهی پیامبهپیام انجام میشود و تغییر مدل بهطور موقت است» و افزود که «ChatGPT هنگام درخواست کاربر اعلام میکند کدام مدل فعال است.» به گفته او، این گامها بخشی از تلاش گستردهتری برای تقویت تدابیر ایمنی و یادگیری از کاربرد واقعی است پیش از گسترش نهایی.
کنترلهای والدینی: امکانات و نگرانیها
قابلیتهای جدید کنترل والدینی به والدین امکان میدهد تجربه نوجوانان را سفارشی کنند؛ از جمله تنظیم ساعات سکوت (quiet hours)، غیرفعالسازی حالت صوتی و حافظه، حذف تولید تصویر و گزینهٔ عدم شرکت در فرایند آموزش مدل. حسابهای نوجوانان همچنین حفاظتهای محتوایی افزودهای دریافت میکنند—مانند کاهش نمایش محتوای گرافیکی و ایدهآلهای افراطی زیبایی—و سیستمی برای تشخیص نشانههای احتمالی افکار خودآسیبی فعال میشود.
روال پاسخ به خطر احتمالی
OpenAI اعلام کرده اگر سامانهها نشانههایی از آسیب احتمالی تشخیص دهند، ابتدا وضعیت توسط تیمی کوچک و آموزشدیده بررسی خواهد شد. در صورت وجود علائم بحران حاد، شرکت میگوید والدین از طریق ایمیل، پیامک و نوتیفیکیشن موبایل مطلع میشوند، مگر اینکه آنها قبلاً این اطلاعرسانی را غیرفعال کرده باشند. این شرکت همچنین در حال تحقیق و توسعه راههایی برای تماس با نیروی انتظامی یا خدمات اورژانسی در صورت تهدید فوری به حیات و عدم امکان دسترسی به والدین است. OpenAI اذعان کرده که سیستم کامل نیست و احتمال آلارمهای کاذب وجود دارد، اما ترجیح داده است در صورت شک، والدین را مطلع کند تا امکان مداخله فراهم باشد.
پیامدها و چشمانداز
اعمال این تغییرات نشاندهنده تلاش OpenAI برای متعادلسازی قابلیتهای پاسخدهی هوش مصنوعی با ملاحظات ایمنی است؛ تلاشی که هم میتواند به کاهش مخاطرات جدی کمک کند و هم با انتقادات مربوط به محدودسازی تجربه کاربری مواجه شود. در هفتهها و ماههای آینده، بازخورد کاربران و نتایج آزمایشهای میدانی تعیینکننده خواهند بود تا ببینیم آیا این سامانهها میتوانند تعادل مطلوبی بین ایمنی و آزادی پاسخدهی برقرار کنند یا نیاز به تغییرات اساسیتری وجود دارد.
