معرفی تکنیک جدید همکاری مدلهای زبانی در Sakana AI
به تازگی آزمایشگاه هوش مصنوعی Sakana AI در ژاپن از یک تکنیک نوآورانه رونمایی کرده است که به مدلهای زبانی بزرگ (LLMs) اجازه میدهد تا در یک اقدام مشترک بر روی یک وظیفه خاص همکاری کنند و به نوعی “تیم رویایی” از عوامل هوش مصنوعی تشکیل دهند. این روش که به نام Multi-LLM AB-MCTS شناخته میشود، به مدلها این امکان را میدهد که از طریق آزمایش و خطا و با ترکیب نقاط قوت منحصر به فرد خود، مسائلی را که برای هر مدل به تنهایی بسیار پیچیده است، حل کنند.
این رویکرد برای شرکتها یک راهکار موثر برای توسعه سیستمهای هوش مصنوعی مقاومتر و با قابلیتهای بالاتر فراهم میآورد. به جای وابستگی به یک تأمینکننده یا مدل مشخص، کسبوکارها میتوانند به طور پویا از مزایای بهترین مدلهای پیشرفته بهرهبرداری کنند و هوش مصنوعی مناسب را برای هر بخش از یک کار اختصاص دهند تا نتایجی برتر حاصل کنند. مدلهای هوش مصنوعی پیشرفته به سرعت در حال تحول هستند و هر یک از این مدلها نقاط قوت و ضعف متمایز خود را بر اساس دادههای آموزشی و ساختار خاص خود دارند. ممکن است یک مدل در برنامهنویسی برتری داشته باشد، در حالی که دیگری در نوشتن خلاقانه تخصص دارد.
محققان Sakana AI معتقدند که این تفاوتها نه تنها محدودیت نیستند، بلکه منابع ارزشمندی برای خلق هوش جمعی به شمار میروند. آنها در وبلاگ خود اظهار میدارند: “ما این偏差ها و استعدادهای مختلف را نه به عنوان محدودیتها، بلکه به عنوان منابع باارزش برای ایجاد هوش جمعی میبینیم.” آنها این باور را دارند که همانطور که بزرگترین دستاوردهای بشری از تیمهای متنوع نشأت میگیرد، سیستمهای هوش مصنوعی نیز میتوانند با همکاری بیشتر، به دستاوردهای قابل توجهی دست یابند.
الگوریتم جدید Sakana AI به عنوان یک تکنیک “افزایش زمان استنباط” (که گاهی به آن “افزایش زمان آزمون” گفته میشود) شناخته میشود. در حالی که بیشتر تمرکزهای قبلی در حوزه هوش مصنوعی بر روی “افزایش زمان آموزش” معطوف شده بود، این روش میتواند عملکرد را با تخصیص منابع محاسباتی بیشتر پس از آموزش مدل افزایش دهد. یکی از روشهای رایج در این حوزه شامل استفاده از یادگیری تقویتی برای ترغیب مدلها به تولید دنبالههای تفکر طولانیتر و دقیقتر است.
در نهایت، با استفاده از الگوریتم جدیدی به نام Adaptive Branching Monte Carlo Tree Search (AB-MCTS)، مدلها میتوانند به طور مؤثر آزمایش و خطا را انجام دهند. این الگوریتم به LLM امکان میدهد که با تعادل هوشمندانه بین دو استراتژی جستجوی “عمیقتر” و “پهنتر”، راهحلهای جدیدی تولید کند.
سپس پژوهشگران Multi-LLM AB-MCTS را آزمایش کردند و نتایج نشان داد که این سیستم 30 درصد از 120 مشکل آزمایشی را به درستی حل کرده است، که این عملکرد به وضوح از قابلیتهای هر مدل به تنهایی فراتر بود. با این تکنیک جدید، شرکتها قادر به بهبود کیفیت برنامههای کاربردی هوش مصنوعی خود خواهند بود و این نوآوری میتواند تحولی جدی در دنیای کسبوکارهای مبتنی بر هوش مصنوعی ایجاد کند.
Sakana AI همچنین الگوریتم خود را به عنوان یک فریمورک متن باز با نام TreeQuest منتشر کرده است که توسعهدهندگان میتوانند از آن برای پیادهسازی Multi-LLM AB-MCTS در پروژههای خود استفاده کنند. با این ابزار، مسیر جدیدی برای ایجاد برنامههای هوش مصنوعی مؤثرتر و قابل اعتمادتر در دنیای کسبوکار باز میشود.