تحقیقات جدید در دانشگاه ایلینوی آرابانا-شمپین و دانشگاه ویرجینیای جنوبی به توسعه یک معماری مدل نوین به نام “ترنسفورمر مبتنی بر انرژی” (EBT) منجر شده است که قابلیتهایی تازه در زمینه هوش مصنوعی و استدلال پیچیده را فراهم میآورد. این معماری به طور طبیعی توانایی مقیاسدهی در زمان استنتاج را در حل مسائل پیچیده بکار میبرد، که برای کسبوکارها میتواند به معنای ایجاد برنامههای هوش مصنوعی مقرون به صرفه باشد که به راحتی به موقعیتهای جدید تعمیم پیدا میکنند.
در روانشناسی، روند تفکر انسان عمدتاً به دو حالت تقسیم میشود: سیستم 1 که سریع و شهودی است و سیستم 2 که آهسته، عمدی و تحلیلی عمل میکند. مدلهای بزرگ زبانی کنونی (LLMs) در انجام وظایف سیستم 1 بسیار موفق عمل کردهاند، اما صنعت هوش مصنوعی به طور فزایندهای به سمت توانمندسازی تفکر سیستم 2 در جهت پردازش چالشهای استدلال پیچیده معطوف شده است. مدلهای استدلال با استفاده از تکنیکهای مختلف مقیاسدهی در زمان استنتاج عملکرد خود را در حل مسائل دشوار بهبود میبخشند.
این تحقیق بر اساس دستهای از مدلها به نام مدلهای مبتنی بر انرژی (EBMs) بنا شده است. ایده اصلی این است که به جای تولید مستقیم یک پاسخ، مدل یک “تابع انرژی” را یاد میگیرد که به عنوان یک ارزیاب عمل میکند. این تابع با دریافت ورودی و یک پیشبینی احتمالی، یک مقدار انرژی را تخصیص میدهد. نمره انرژی پایین نشاندهنده تطابق بالا و نمره انرژی بالا نشاندهنده عدم تطابق است.
این معماری به محققان اجازه میدهد تا شیرینی منابع محاسباتی را به طور داینامیک تخصیص دهند. بنابراین مدلها میتوانند برای مسائل دشوار زمان بیشتری را صرف کنند و برای مسائل سادهتر زمان کمتری را اختصاص دهند. همچنین EBMs به طور طبیعی با عدم قطعیت مسائل دنیای واقعی که پاسخ واحدی ندارند، سازگار هستند.
با معرفی ترنسفورمرهای مبتنی بر انرژی (EBTs)، این مدلها برای مقیاسپذیری طراحی شدهاند. EBTs میتوانند تطابق میان یک زمینه و یک پیشبینی را ابتدا بررسی کرده و سپس پیشبینیها را برای یافتن خروجی با کمترین انرژی بهینهسازی کنند. این فرآیند به طور مؤثری یک روند تفکر را برای هر پیشبینی شبیهسازی میکند.
در ارزیابیهای اولیه، EBTs عملکرد بهتری در نسبت به مدلهای موجود نشان دادهاند و در تواناییهای مقیاسدهی و تفکر، نسبت به سایر معماریها، مزیتهای قابل توجهی دارند. این مدلها در محیطهایی که دادههای جدید و چالشبرانگیز هستند، به خوبی عمل میکنند و به ویژه در زمینههای تصمیمگیری مهم و با دادههای محدود، جذابیت بیشتری دارند.
در نهایت، سازگاری و تواناییهای شگفتانگیز EBTs میتواند آینده هوش مصنوعی را متحول کند و به عنوان پایهای قوی برای ساخت نسل بعدی برنامههای هوش مصنوعی در کسبوکارها عمل کند.