تحقیقات گروه Alibaba به تازگی رویکردی نوین را توسعه داده است که میتواند هزینه و پیچیدگی آموزش سامانههای هوش مصنوعی برای جستجوی اطلاعات را به طور قابل توجهی کاهش دهد. این تکنیک که “ZeroSearch” نام دارد، به مدلهای زبانی بزرگ (LLMs) این امکان را میدهد که تواناییهای جستجوی پیشرفته را از طریق یک رویکرد شبیهسازی شده و بدون نیاز به تعامل با موتورهای جستجوی واقعی در طول فرآیند آموزش توسعه دهند. این نوآوری میتواند هزینههای قابل توجهی را برای شرکتها به ارمغان آورد و کنترل بیشتری بر نحوه یادگیری سامانههای هوش مصنوعی در جستجوی اطلاعات فراهم کند.
طبق گزارشی که محققان در این هفته در arXiv منتشر کردهاند، آموزش مبتنی بر یادگیری تقویتی (RL) نیازمند راهاندازیهای مکرر بوده و ممکن است شامل صدها هزار درخواست جستجو باشد که این امر مستلزم هزینههای بالای API و محدودیتهای جدی در مقیاسپذیری است. در راستای حل این چالشها، محققان “ZeroSearch” را معرفی کردهاند که یک چارچوب یادگیری تقویتی است که تواناییهای جستجوی LLMها را بدون تعامل با موتورهای جستجوی واقعی تقویت میکند.
مشکل اصلی که “ZeroSearch” به آن پاسخ میدهد، دو چالش بزرگ برای شرکتهایی است که در حال توسعه دستیاران هوش مصنوعی هستند: کیفیت غیرقابل پیشبینی مستندات بازگشتی از موتورهای جستجو در طول آموزش و هزینههای بالا برای ایجاد صدها هزار تماس API با موتورهای جستجوی تجاری مانند گوگل. رویکرد Alibaba با یک فرآیند نازک و تحت نظارت برای بهینهسازی یک LLM به عنوان یک ماژول بازیابی آغاز میشود که قادر به تولید مستندات مرتبط و غیرمرتبط در پاسخ به یک درخواست است.
بررسیهای جامعی در هفت مجموعه داده پرسش و پاسخ نشان میدهد که “ZeroSearch” نه تنها عملکرد مدلهای آموزش دیده با موتورهای جستجوی واقعی را تطبیق میدهد، بلکه غالباً از آنها پیشی میگیرد. ماژول 7B پارامتری به عملکردی مشابه جستجوی گوگل دست یافته و ماژول 14B پارامتری حتی از آن نیز پیشی گرفته است. طبق تحلیل محققان، آموزش با حدود 64,000 درخواست جستجو از طریق Google Search به هزینهای حدود 586.70 دلار نیاز دارد، در حالی که استفاده از یک LLM شبیهسازی شده با 14B پارامتر بر روی چهار GPU A100 تنها 70.80 دلار هزینه دارد که کاهش 88 درصدی را نشان میدهد.
این دستاورد، تحولی عمده در روشهای آموزش سامانههای هوش مصنوعی ایجاد میکند و نشان میدهد که AI میتواند بدون وابستگی به ابزارهای خارجی مانند موتورهای جستجو، بهبود یابد. این تغییر میتواند تأثیر زیادی بر صنعت هوش مصنوعی داشته باشد. تا کنون، آموزش سیستمهای پیشرفته هوش مصنوعی معمولاً نیازمند تماسهای گرانقیمت API به خدماتی بود که تحت کنترل شرکتهای بزرگ فناوری قرار داشتند.
“ZeroSearch” این معادله را تغییر میدهد و امکان شبیهسازی جستجو را به جای استفاده از موتورهای جستجوی واقعی فراهم میکند. برای شرکتهای کوچک و استارتاپها با بودجه محدود، این رویکرد میتواند میدان بازی را هموار کند. هزینههای بالا برای تماسهای API مانع اصلی ورود به توسعه دستیاران هوش مصنوعی پیشرفته بوده است و “ZeroSearch” با کاهش این هزینهها به میزان نزدیک به 90%، دسترسی به آموزش پیشرفته AI را تسهیل میکند.
علاوه بر صرفهجویی در هزینه، این تکنیک کنترل بیشتری بر فرآیند آموزش به توسعهدهندگان میدهد. استفاده از جستجوی شبیهسازی شده، به توسعهدهندگان این امکان را میدهد که بهطور دقیقتری آنچه را که AI در طول آموزش مشاهده میکند، کنترل کنند. این تکنیک بر روی چندین خانواده مدل، از جمله Qwen-2.5 و LLaMA-3.2 و همچنین با نسخههای پایه و تنظیم شده برای دستورالعملها کار میکند.
محققان کد، مجموعه دادهها و مدلهای پیشآموزش شده خود را در GitHub و Hugging Face در دسترس قرار دادهاند و این امکان را برای سایر محققان و شرکتها فراهم میکنند که این رویکرد را پیادهسازی کنند. همچنان که مدلهای زبانی بزرگ به تحول خود ادامه میدهند، تکنیکهایی مانند “ZeroSearch” نشاندهنده آیندهای هستند که در آن سیستمهای هوش مصنوعی میتوانند از طریق خود-شبیهسازی، تواناییهای پیچیدهتری را توسعه دهند و وابستگیهای خود به خدمات خارجی را کاهش دهند.