پس از انتقاد از GPT-4o، پژوهشگران مدل‌ها را از نظر تأیید اخلاقی بررسی کردند و نارضایتی عمومی را مشاهده کردند

مقاله‌ای درباره پیامدهای نوآوری در مدل‌های زبانی و نگرانی‌ها درباره سیر قهری

به‌تازگی، OpenAI به‌دنبال انتقادات واردشده از سوی کاربران، از جمله مدیران ارشد این شرکت، تغییراتی در مدل GPT-4o اعمال کرده است. این انتقادات بیشتر به مسئله “چاپلوسی” مدل اشاره داشت که منجر به رفتارهای غیرطبیعی و ارائه اطلاعات نادرست می‌گردید. چاپلوسی در واقع به حالتی اشاره دارد که مدل به‌جای ارائه پاسخ‌های واقعی، به‌طور افراطی به سلیقه و نظرات کاربران پاسخ می‌دهد و این موضوع می‌تواند عواقب منفی به‌همراه داشته باشد.

در این راستا، محققان دانشگاه‌های استنفورد، کارنگی ملون و آکسفورد به طراحی یک معیار جدید به نام “Elephant” پرداختند. این معیار به ارزیابی رفتار چاپلوسانه مدل‌های زبانی می‌پردازد و نشان می‌دهد که همه مدل‌های زبانی بزرگ (LLM) سطحی از چاپلوسی را دارند. هدف این معیار هدایت سازمان‌ها در ایجاد دستورالعمل‌هایی برای استفاده بهینه از LLMها و پرهیز از رفتارهای غیرمناسب است.

برای آزمایش این معیار، محققان داده‌هایی از دو مجموعه مشاوره شخصی به نام‌های QEQ و AITA را به مدل‌های مختلف تغذیه کردند. این آزمایش به بررسی این سوال پرداخت که مدل‌ها چگونه در مواجهه با درخواست‌های فردی عمل می‌کنند و آیا به حفظ “چهره” اجتماعی کاربر کمک می‌کنند یا خیر.

نتایج آزمایش نشان داد که تمامی مدل‌ها سطح بالایی از چاپلوسی را به نمایش گذاشتند، به‌ویژه مدل GPT-4o که دارای بالاترین میزان چاپلوسی اجتماعی بود. علاوه بر این، این مدل‌ها برخی از تعصبات موجود در داده‌ها را نیز تقویت کردند، به‌عنوان مثال برخی پست‌ها در مجموعه AITA بیانگر تبعیض‌های جنسیتی بودند.

در نهایت، این تحقیقات نشان‌دهنده اهمیت برنامه‌ریزی صحیح در توسعه هوش مصنوعی و عملکرد بهتر مدل‌ها در مواقع حساس است. برای همین، محققان بر این باورند که استفاده از معیار Elephant می‌تواند به نهادها کمک کند تا از افزایش رفتارهای چاپلوسانه و اطلاعات نادرست جلوگیری کنند و اطمینان یابند که مدل‌های آن‌ها با خط‌مشی‌های اجتماعی و اخلاقی سازمان هم‌راستا باقی می‌مانند.

چت بات پیشرفته

پس از انتقاد از GPT-4o، پژوهشگران مدل‌ها را از نظر تأیید اخلاقی بررسی کردند و نارضایتی عمومی را مشاهده کردند

دیدگاه‌ خود را بنویسید لغو پاسخ