اُپنای آی، شرکت توسعهدهنده یکی از محبوبترین مدلهای هوش مصنوعی، به تازگی بیانیهای را درباره مشکلات مرتبط با حالت ارائه شده توسط مدل پیشفرض ChatGPT یعنی GPT-4o منتشر کرده است. این مشکلات باعث شدند تا این شرکت مجبور به بازگشت به نسخه قبلی این مدل، پس از انتشار یک بهروزرسانی در هفته گذشته شود.
در روزهای اخیر، پس از بهروزرسانی مدل GPT-4o، کاربران در شبکههای اجتماعی به این نکته اشاره کردند که ChatGPT واکنشهایی بیش از حد تأییدکننده و موافق ارائه میدهد که سریعاً به یک موضوع داغ و شوخی در فضای مجازی تبدیل شد. کاربران تصاویری از ChatGPT منتشر کردند که به تحسین ایدهها و تصمیمات ناپسند و خطرناک میپرداخت. در یک پست در شبکه اجتماعی X، سم آلتمن، مدیر عامل اُپنای آی، این مشکل را تایید کرد و اعلام کرد که این شرکت به دنبال رفع آن بهطور فوری است.
دو روز بعد، آلتمن اعلام کرد که بهروزرسانی مدل GPT-4o بازگردانده خواهد شد و شرکت در حال کار بر روی “رفعهای اضافی” برای شخصیت این مدل است. به گفته اُپنای آی، این بهروزرسانی که با هدف ایجاد شخصیتی “بیشتر شهودی و مؤثر” بود، بیش از حد تحت تأثیر “بازخوردهای کوتاهمدت” قرار گرفت و “کاملاً توجه به این موضوع نداشت که تعاملهای کاربران با ChatGPT در طول زمان چگونه تکامل مییابد.”
اُپنای آی در اطلاعیهای اعلام کرد: “ما به دلیل رفتارهای بیش از حد مروتمند و تأییدکننده این بهروزرسانی را بازگرداندیم. شما اکنون به نسخه قبلی با رفتارهای متعادلتر دسترسی پیدا کردهاید.” این شرکت در وبلاگ خود افزود: “در نتیجه، GPT-4o به سمت پاسخهایی متمایل شد که بیش از حد پشتیبان اما غیرصادقانه بودند.” این رفتارهای مفرط میتوانند سبب نارضایتی و احساس سوءتفاهم شوند.
شرکت در تلاش است تا چندین راهکار را اجرا کند که شامل بهبود تکنیکهای آموزش مدل اصلی و دستورهای سیستمی برای هدایت GPT-4o به دور از رفتارهای مروتمند است. از سوی دیگر، اُپنای آی در حال ساخت دیوارههای حفاظتی بیشتری برای “افزایش صداقت و شفافیت مدل” و گسترش ارزیابیهای خود برای “شناسایی مشکلات فراتر از رفتارهای مروتمند” است.
این شرکت همچنین در حال آزمایش روشهایی برای ارائه “بازخورد در زمان واقعی” به کاربران به منظور “تأثیرگذاری مستقیم بر تعاملات خود با ChatGPT” و انتخاب از میان چندین شخصیت مختلف ChatGPT است. بر اساس گفتههای اُپنای آی، این شرکت به دنبال یافتن راههای جدیدی برای گنجاندن بازخوردهای گسترده و دموکراتیک در رفتارهای پیشفرض ChatGPT است تا بتواند ارزشهای فرهنگی متنوع در سطح جهان را بهتر منعکس کند و بفهمد که کاربران چگونه میخواهند ChatGPT اقدام به تغییر کند.
اُپنای آی اعلام کرده است که همچنین کاربران باید کنترل بیشتری بر رفتار ChatGPT داشته باشند و در صورت عدم توافق با رفتار پیشفرض، توانایی تنظیماتی را داشته باشند، تا حدی که ایمن و امکانپذیر باشد.