سم آلتمن: رباتها تشخیص پستهای انسانی در شبکههای اجتماعی را ناممکن کردهاند
رئیس و سهامدار Reddit و مدیرعامل OpenAI، سم آلتمن، در پستی در X (توئیتر سابق) اعلام کرد که تجربهای باعث شده باور کند دیگر نمیتوان بهاطمینان گفت کدام پستهای شبکههای اجتماعی توسط انسان نوشته شدهاند و کدامیک توسط ربات یا مدلهای زبانی بزرگ (LLM). این تأمل پس از خواندن و بهاشتراکگذاری مطالبی از سابردیت r/Claudecode رخ داد که به تبلیغ و تمجید از OpenAI Codex میپرداختند — سرویسی که در ماه مه برای برنامهنویسی نرمافزار منتشر شد و رقیب محصول Anthropic یعنی Claude Code محسوب میشود.
آلتمن توضیح داد که با مشاهده سیلی از پستهای موافق با Codex در آن انجمن، دچار تردید شده است که چه تعداد از این واکنشها واقعاً از سوی کاربران انسانی هستند. او سپس عوامل احتمالی این وضعیت را بهصورت زنده تحلیل کرد: یادگیری صفات زبانی مدلها توسط انسانها، همسو شدن جمعهای «بسیار آنلاین»، چرخه هیجان و افولِ هِیپ، فشار الگوریتمهای شبکههای اجتماعی برای افزایش تعامل، سازوکارهای درآمدزایی سازندگان محتوا، احتمال عملیات «آستروتِرفینگ» (پستهای هماهنگ یا پرداختشده که ظاهراً ارگانیک بهنظر میرسند) و البته حضور برخی رباتها.
آستروتِرفینگ اصطلاحی است که به کوششهای سازماندهیشده یا پرداختشده برای شکلدادن به نظر عمومی – غالباً با استفاده از رباتها یا حسابهای تولیدشده بهصورت مصنوعی – اطلاق میشود؛ ادعایی که فعلاً شواهد عمومی روشنی برای آن وجود ندارد اما امکان آن مطرح شده است. گفتنی است مدلهای OpenAI از محتوای عمومی اینترنت و از جمله ردیت برای آموزش استفاده کردهاند و خودِ آلتمن تا سال 2022 عضو هیئتمدیره Reddit بود و در زمان عرضه عمومی شرکت، سهامدار آن معرفی شد؛ مسائلی که حساسیت او نسبت به اصالت محتوا را تشدید میکند.
نمونهای ملموس از پیچیدگی رابطه میان کاربران و مدلها، واکنش جامعه کاربران نسبت به عرضه GPT-5 بود. برخلاف انتظار، انتشار این نسخه جدید با موجی از انتقادها در سابردیتهای مرتبط همراه شد؛ کاربران درباره شخصیت مدل، مصرف بیثمر اعتبارات و مشکلات عملکردی گلایه کردند. آلتمن در یک جلسه Ask Me Anything در ردیت نیز به مشکلات عرضه اعتراف و وعده اصلاح داد، اما انجمنها تا کنون قدری از اعتماد قبلی را بازنیافتهاند.
آمارها و گزارشها نیز به افزایش سهم ترافیک غیرانسانی اشاره دارند. شرکت امنیت داده Imperva گزارش کرده که بیش از نیمی از ترافیک اینترنت در سال 2024 غیرانسانی بوده است که بخش بزرگی از آن ناشی از فعالیتهای خودکار و مدلهای زبانی عنوان شده است. همچنین به نقل از تیم بات X، برآوردها از صدها میلیون بات فعال در این پلتفرم حکایت دارد. با این حال، تعیین دقیق سهم پستهای تولیدشده توسط ربات یا محتوای ساختهشده توسط انسان با کمک LLM همچنان دشوار است.
آلتمن حتی این پرسش را مطرح کرد که آیا شکوهمندترین خواهان فناوری (و شاید برنامههای احتمالی OpenAI برای ورود به حوزه شبکههای اجتماعی) میتوانند محیطی عاری از ربات بسازند؟ تجربهها و پژوهشها نشان میدهد نه لزوماً: آزمایش محققان دانشگاه آمستردام که شبکهای متشکل از رباتها ایجاد کردند نشان داد حتی میان رباتها نیز طائفهسازی و اتاقهای پژواک شکل میگیرد و مسائل اصالت و همگونسازی دیدگاه همچنان پابرجا است.
پیام اصلی این رویدادها روشن است: پیشرفت مدلهای زبانی بزرگ در تولید متن، به همراه انگیزههای الگوریتمی شبکههای اجتماعی و پویشهای سازمانیافته، مرزهای تشخیص محتوای انسانی را محو کرده است. این موضوع پیامدهای گستردهای برای اعتبارسنجی خبر، سلامت فضای گفتگو، آموزش و قضاوت قانونی دارد. راهحلهای احتمالی شامل افزایش شفافیت منابع تولید محتوا، استانداردهای نشانهگذاری برای محتوای تولیدشده توسط هوش مصنوعی، بهبود ابزارهای شناسایی خودکار رباتها و بازنگری در سازوکارهای انگیزشی پلتفرمها است — اقداماتی که برای بازگرداندن اعتماد به شبکههای اجتماعی و مهار پیامدهای منفی تولید خودکار محتوا ضروری بهنظر میرسند.
