عنوان: «بهبود بازگشتی خودکار (RSI)؛ واژهکلیدی تازه در بحثهای هوش مصنوعی و مسیر نامطمئن رسیدن به سوپرهوش»
در چند ماه اخیر اصطلاح «بازگشتپذیری» یا بهطور دقیقتر «بهبود بازگشتی خودکار» (Recursive Self-Improvement — RSI) به یکی از کلمات کلیدی جنجالی در جامعه هوش مصنوعی تبدیل شده است. چند استارتآپ نام خود را حول این مفهوم انتخاب کردهاند و گروهی از پژوهشگران آن را در نقشه راه پژوهشی خود برجسته میکنند. در یک تعریف ساده، RSI به سامانههای هوشمندی اشاره دارد که توانایی ارتقاء مستمر خود را دارند؛ یعنی وقتی یک مدل یا مجموعهای از عوامل (agents) بهتر از انسانها چرخهٔ تولید ایده، پیادهسازی و اعتبارسنجی را مدیریت کنند، فرایند میتواند به یک حلقه بسته تبدیل شود که تنها به توان محاسباتی در دسترس محدود میشود — و نقش انسانها کماهمیت یا حتی غیرضروری خواهد شد.
چه کسانی دنبال RSI هستند؟
– ریچارد سوشِر (Richard Socher) اخیراً پروژهای با نام «Recursive Superintelligence» راهاندازی کرد و صراحتاً هدف خود را ساخت «سوپرهوش بازگشتی» در مقیاس عملیاتی اعلام کرد. او میگوید قصد دارند فرایند ایدهپردازی، اجرا و اعتبارسنجی ایدههای پژوهشی را تا حد امکان خودکار کنند.
– آندریِی کارپاتی (Andrej Karpathy)، چهرهٔ شناختهشدهٔ سابق تسلا و OpenAI، پروژهای به نام Auto-Research را با ایدهٔ آموزش دستهای از عوامل (agent swarms) برای انجام پژوهشهای مقیاسی کوچک راهاندازی کرده است. کارپاتی بخشهایی از پیشرفتهای خود را بهصورت متنباز منتشر کرده؛ هرچند تاکنون نتایج عمدتاً به بهبودهای جزئی در مقیاس مدلهای GPT-2 محدود شدهاند.
– شرکت Adaption (با بنیانگذاری سارا هوکر از Cohere و گوگل) ابزار AutoScientist را برای خودکارسازی آموزش مدلهای سطح پیشگام معرفی کرده که هدف آن تسهیل آموزش مدلهای بزرگ است.
– دوریس ژین (Doris Xin) و تیم او نشان دادند که یک عامل یادگیری ماشینی خودآموز توانست در رقابتهای کگل (Kaggle) پیروز شود و مدالهایی کسب کند، که پرسشها و بحثهایی دربارهٔ قابلیت اتکا و مقیاسپذیری این نوع سیستمها را برانگیخت.
آیا RSI نزدیک است یا دور؟
نظر کارشناسان یکدست نیست. برخی بهسرعت از احتمال وقوع یک انفجار پژوهشی و رشد نمایی سخن میگویند، و برخی دیگر پیشبینی پیشرفت آرامتر و در نهایت یک سرازیر شدن یا ایست در توسعه را دارند. گزارشهایی از شرکتهایی مانند Anthropic نشان میدهد که ابزارهایی مثل Claude Code در تولید کد نقش بسیار بالایی دارند — حتی یکی از برنامهنویسان ارشد Anthropic گفته بود نزدیک به 100٪ کد تیمش توسط ابزار نوشته میشد — اما ضعفها در حوزههایی که مستلزم خودهدایت، درک اولویتهای سازمانی، سنجش ذوق و اعتبارسنجی بلندمدت است، همچنان وجود دارد.
چارچوبی برای سنجش مراحل پیشرفت
Ajeya Cotra از METR تقسیمبندی مفیدی ارائه داده است:
– «شایستگی» (adequacy): سامانه میتواند حتی بدون حضور افراد انسان، پژوهشی تولید کند، هرچند شاید کیفیت یا کارایی آن پایینتر باشد.
– «توازن» (parity): سامانهٔ مبتنی بر هوش مصنوعی به اندازهٔ تیم انسان-محور در پژوهش عملکرد دارد.
– «برتری» (supremacy): سامانهٔ هوش مصنوعی تنها از یک تیم ترکیبی انسان-هوش مصنوعی بهتر عمل میکند.
برخی متخصصان معتقدند احتمالاً آستانهٔ «شایستگی» در حال نزدیک شدن است یا حتی اکنون گذرانده شده، اما رسیدن به توازن و سپس برتری میتواند ظرف زمانی متفاوت و با پیامدهایی بسیار سریع و گسترده همراه باشد.
چالشهای بزرگ فنی و اخلاقی
حتی اگر امکان فنی ساخت حلقههای خودبهبود فراهم باشد، مشکلات کلیدی وجود دارند:
– محدودیتهای محاسباتی: منابع نامحدود در دسترس نیستند و هزینهٔ محاسباتی و انرژی محدودیت عملی ایجاد میکند.
– مهندسی فرایند پژوهش: خودکارسازی کامل همه مراحل پژوهش — از پرسشگذاری و طراحی آزمایش تا تفسیر نتایج و تأیید علمی — یک چالش عظیم است.
– اصل همراستایی (alignment): تضمین اینکه سیستمهای خودبهبود مسیرهایی سازگار با ارزشها و اهداف انسانی را دنبال کنند، یکی از دشوارترین مسائل است.
– اعتماد و پذیرش اجتماعی: شفافیت، پاسخگویی و مدیریت ریسک در مواجهه با جامعه و نهادهای قانونگذار نیازمند کار بیشتر است.
جمعبندی
بهبود بازگشتی خودکار (RSI) اکنون به موضوعی محوری در میان برخی پژوهشگران و شرکتهای حوزهٔ هوش مصنوعی تبدیل شده است. تلاشها در قالب پروژههایی مثل Auto-Research، AutoScientist و پروژههای متنباز نشان میدهد که گامهای اولیه برداشته شدهاند، اما میان توانایی تولید بهبودهای موضعی و رسیدن به یک حلقهٔ خودتکاملدهندهٔ کامل فاصلۀ زیادی وجود دارد. بیشتر کارشناسان متفقالقولاند که اگرچه پیشرفتها چشمگیر است، اما سوپرهوش بازگشتیِ apocalyptic هنوز دیده نشده و رسیدن به آن مستلزم غلبه بر چالشهای فنی، محاسباتی و همراستایی فکری-قانونی است.
