معرفی تکنیک جدید همکاری مدل‌های زبانی در Sakana AI

به تازگی آزمایشگاه هوش مصنوعی Sakana AI در ژاپن از یک تکنیک نوآورانه رونمایی کرده است که به مدل‌های زبانی بزرگ (LLMs) اجازه می‌دهد تا در یک اقدام مشترک بر روی یک وظیفه خاص همکاری کنند و به نوعی “تیم رویایی” از عوامل هوش مصنوعی تشکیل دهند. این روش که به نام Multi-LLM AB-MCTS شناخته می‌شود، به مدل‌ها این امکان را می‌دهد که از طریق آزمایش و خطا و با ترکیب نقاط قوت منحصر به فرد خود، مسائلی را که برای هر مدل به تنهایی بسیار پیچیده است، حل کنند.

این رویکرد برای شرکت‌ها یک راهکار موثر برای توسعه سیستم‌های هوش مصنوعی مقاوم‌تر و با قابلیت‌های بالاتر فراهم می‌آورد. به جای وابستگی به یک تأمین‌کننده یا مدل مشخص، کسب‌وکارها می‌توانند به طور پویا از مزایای بهترین مدل‌های پیشرفته بهره‌برداری کنند و هوش مصنوعی مناسب را برای هر بخش از یک کار اختصاص دهند تا نتایجی برتر حاصل کنند. مدل‌های هوش مصنوعی پیشرفته به سرعت در حال تحول هستند و هر یک از این مدل‌ها نقاط قوت و ضعف متمایز خود را بر اساس داده‌های آموزشی و ساختار خاص خود دارند. ممکن است یک مدل در برنامه‌نویسی برتری داشته باشد، در حالی که دیگری در نوشتن خلاقانه تخصص دارد.

محققان Sakana AI معتقدند که این تفاوت‌ها نه تنها محدودیت نیستند، بلکه منابع ارزشمندی برای خلق هوش جمعی به شمار می‌روند. آن‌ها در وبلاگ خود اظهار می‌دارند: “ما این偏差ها و استعدادهای مختلف را نه به عنوان محدودیت‌ها، بلکه به عنوان منابع باارزش برای ایجاد هوش جمعی می‌بینیم.” آن‌ها این باور را دارند که همان‌طور که بزرگ‌ترین دستاوردهای بشری از تیم‌های متنوع نشأت می‌گیرد، سیستم‌های هوش مصنوعی نیز می‌توانند با همکاری بیشتر، به دستاوردهای قابل توجهی دست یابند.

الگوریتم جدید Sakana AI به عنوان یک تکنیک “افزایش زمان استنباط” (که گاهی به آن “افزایش زمان آزمون” گفته می‌شود) شناخته می‌شود. در حالی که بیشتر تمرکز‌های قبلی در حوزه هوش مصنوعی بر روی “افزایش زمان آموزش” معطوف شده بود، این روش می‌تواند عملکرد را با تخصیص منابع محاسباتی بیشتر پس از آموزش مدل افزایش دهد. یکی از روش‌های رایج در این حوزه شامل استفاده از یادگیری تقویتی برای ترغیب مدل‌ها به تولید دنباله‌های تفکر طولانی‌تر و دقیق‌تر است.

در نهایت، با استفاده از الگوریتم جدیدی به نام Adaptive Branching Monte Carlo Tree Search (AB-MCTS)، مدل‌ها می‌توانند به طور مؤثر آزمایش و خطا را انجام دهند. این الگوریتم به LLM امکان می‌دهد که با تعادل هوشمندانه بین دو استراتژی جستجوی “عمیق‌تر” و “پهن‌تر”، راه‌حل‌های جدیدی تولید کند.

سپس پژوهشگران Multi-LLM AB-MCTS را آزمایش کردند و نتایج نشان داد که این سیستم 30 درصد از 120 مشکل آزمایشی را به درستی حل کرده است، که این عملکرد به وضوح از قابلیت‌های هر مدل به تنهایی فراتر بود. با این تکنیک جدید، شرکت‌ها قادر به بهبود کیفیت برنامه‌های کاربردی هوش مصنوعی خود خواهند بود و این نوآوری می‌تواند تحولی جدی در دنیای کسب‌وکارهای مبتنی بر هوش مصنوعی ایجاد کند.

Sakana AI همچنین الگوریتم خود را به عنوان یک فریمورک متن باز با نام TreeQuest منتشر کرده است که توسعه‌دهندگان می‌توانند از آن برای پیاده‌سازی Multi-LLM AB-MCTS در پروژه‌های خود استفاده کنند. با این ابزار، مسیر جدیدی برای ایجاد برنامه‌های هوش مصنوعی مؤثرتر و قابل اعتمادتر در دنیای کسب‌وکار باز می‌شود.

تجزیه و تحلیل تصویر با هوش مصنوعی

دیدگاه‌ خود را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

اسکرول به بالا