تحقیقات گروه Alibaba به تازگی رویکردی نوین را توسعه داده است که می‌تواند هزینه و پیچیدگی آموزش سامانه‌های هوش مصنوعی برای جستجوی اطلاعات را به طور قابل توجهی کاهش دهد. این تکنیک که “ZeroSearch” نام دارد، به مدل‌های زبانی بزرگ (LLMs) این امکان را می‌دهد که توانایی‌های جستجوی پیشرفته را از طریق یک رویکرد شبیه‌سازی شده و بدون نیاز به تعامل با موتورهای جستجوی واقعی در طول فرآیند آموزش توسعه دهند. این نوآوری می‌تواند هزینه‌های قابل توجهی را برای شرکت‌ها به ارمغان آورد و کنترل بیشتری بر نحوه یادگیری سامانه‌های هوش مصنوعی در جستجوی اطلاعات فراهم کند.

طبق گزارشی که محققان در این هفته در arXiv منتشر کرده‌اند، آموزش مبتنی بر یادگیری تقویتی (RL) نیازمند راه‌اندازی‌های مکرر بوده و ممکن است شامل صدها هزار درخواست جستجو باشد که این امر مستلزم هزینه‌های بالای API و محدودیت‌های جدی در مقیاس‌پذیری است. در راستای حل این چالش‌ها، محققان “ZeroSearch” را معرفی کرده‌اند که یک چارچوب یادگیری تقویتی است که توانایی‌های جستجوی LLMها را بدون تعامل با موتورهای جستجوی واقعی تقویت می‌کند.

مشکل اصلی که “ZeroSearch” به آن پاسخ می‌دهد، دو چالش بزرگ برای شرکت‌هایی است که در حال توسعه دستیاران هوش مصنوعی هستند: کیفیت غیرقابل پیش‌بینی مستندات بازگشتی از موتورهای جستجو در طول آموزش و هزینه‌های بالا برای ایجاد صدها هزار تماس API با موتورهای جستجوی تجاری مانند گوگل. رویکرد Alibaba با یک فرآیند نازک و تحت نظارت برای بهینه‌سازی یک LLM به عنوان یک ماژول بازیابی آغاز می‌شود که قادر به تولید مستندات مرتبط و غیرمرتبط در پاسخ به یک درخواست است.

بررسی‌های جامعی در هفت مجموعه داده پرسش و پاسخ نشان می‌دهد که “ZeroSearch” نه تنها عملکرد مدل‌های آموزش دیده با موتورهای جستجوی واقعی را تطبیق می‌دهد، بلکه غالباً از آن‌ها پیشی می‌گیرد. ماژول 7B پارامتری به عملکردی مشابه جستجوی گوگل دست یافته و ماژول 14B پارامتری حتی از آن نیز پیشی گرفته است. طبق تحلیل محققان، آموزش با حدود 64,000 درخواست جستجو از طریق Google Search به هزینه‌ای حدود 586.70 دلار نیاز دارد، در حالی که استفاده از یک LLM شبیه‌سازی شده با 14B پارامتر بر روی چهار GPU A100 تنها 70.80 دلار هزینه دارد که کاهش 88 درصدی را نشان می‌دهد.

این دستاورد، تحولی عمده در روش‌های آموزش سامانه‌های هوش مصنوعی ایجاد می‌کند و نشان می‌دهد که AI می‌تواند بدون وابستگی به ابزارهای خارجی مانند موتورهای جستجو، بهبود یابد. این تغییر می‌تواند تأثیر زیادی بر صنعت هوش مصنوعی داشته باشد. تا کنون، آموزش سیستم‌های پیشرفته هوش مصنوعی معمولاً نیازمند تماس‌های گران‌قیمت API به خدماتی بود که تحت کنترل شرکت‌های بزرگ فناوری قرار داشتند.

“ZeroSearch” این معادله را تغییر می‌دهد و امکان شبیه‌سازی جستجو را به جای استفاده از موتورهای جستجوی واقعی فراهم می‌کند. برای شرکت‌های کوچک و استارتاپ‌ها با بودجه محدود، این رویکرد می‌تواند میدان بازی را هموار کند. هزینه‌های بالا برای تماس‌های API مانع اصلی ورود به توسعه دستیاران هوش مصنوعی پیشرفته بوده است و “ZeroSearch” با کاهش این هزینه‌ها به میزان نزدیک به 90%، دسترسی به آموزش پیشرفته AI را تسهیل می‌کند.

علاوه بر صرفه‌جویی در هزینه، این تکنیک کنترل بیشتری بر فرآیند آموزش به توسعه‌دهندگان می‌دهد. استفاده از جستجوی شبیه‌سازی شده، به توسعه‌دهندگان این امکان را می‌دهد که به‌طور دقیق‌تری آنچه را که AI در طول آموزش مشاهده می‌کند، کنترل کنند. این تکنیک بر روی چندین خانواده مدل، از جمله Qwen-2.5 و LLaMA-3.2 و همچنین با نسخه‌های پایه و تنظیم شده برای دستورالعمل‌ها کار می‌کند.

محققان کد، مجموعه داده‌ها و مدل‌های پیش‌آموزش شده خود را در GitHub و Hugging Face در دسترس قرار داده‌اند و این امکان را برای سایر محققان و شرکت‌ها فراهم می‌کنند که این رویکرد را پیاده‌سازی کنند. همچنان که مدل‌های زبانی بزرگ به تحول خود ادامه می‌دهند، تکنیک‌هایی مانند “ZeroSearch”‌ نشان‌دهنده آینده‌ای هستند که در آن سیستم‌های هوش مصنوعی می‌توانند از طریق خود-شبیه‌سازی، توانایی‌های پیچیده‌تری را توسعه دهند و وابستگی‌های خود به خدمات خارجی را کاهش دهند.

تبدیل متن‌های فارسی به صوت طبیعی و روان

دیدگاه‌ خود را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

اسکرول به بالا