به گزارش سایت بینا ویرا، استارتاپ هوش مصنوعی ساكنا مستقر در توکیو، که بهدست دانشمندان برجسته سابق گوگل تأسیس شده است، از معماری جدیدی به نام ماشینهای تفکر پیوسته (CTM) رونمایی کرده است. CTMها بهگونهای طراحی شدهاند که نسل جدیدی از مدلهای زبان هوش مصنوعی را ارائه دهند که قابلیتهای بیشتری برای انجام وظایف شناختی پیچیده مانند حل معماهای پیچیده یا انجام کارهای حرکتی بدون نیاز به نشانههای موقعیتی داشته باشند، و به شکلگیری روشهای استدال انسانی نزدیکتر شوند.
بر خلاف مدلهای ترنسفورمر که دادهها را بهصورت همزمان پردازش میکنند، CTMها محاسبات را در مراحل داخلی واحدهای ورودی/خروجی، که به آن “نورونهای مصنوعی” گفته میشود، گسترش میدهند. هر نورون در این مدل، تاریخچهای از فعالیتهای قبلی خود را حفظ میکند و از این حافظه برای تصمیمگیری درباره زمان فعالسازی مجدد استفاده میکند. این ساختار داخلی اضافه به CTMها امکان میدهد تا عمق و مدت استدلال خود را بر اساس پیچیدگی وظایف بهصورت دینامیکی تنظیم کنند.
کاغذی که به توصیف این فناوری پرداخته است، بهصورت عمومی در نشریه arXiv منتشر شده و شامل یک میکروسایت و یک مخزن گیتهاب برای سهولت دسترسی به این اطلاعات است. اکثر مدلهای زبان بزرگ (LLM) امروزی همچنان بر اساس معماری “ترنسفورمر” بنا شدهاند که در مقاله کلیدی ۲۰۱۷ پژوهشگران گوگل برین ارائه شده است. این مدلها با استفاده از لایههای ثابت سطح عمق، ورودیها را در یک بار پردازش میکنند، در حالی که CTMها به هر نورون اجازه میدهند که بر اساس زمان داخلی خود عمل کند و تصمیمات فعالسازی را بر مبنای حافظه کوتاهمدت خود اتخاذ کنند.
ساکنا معتقد است که CTMها گامی به سوی هوش بیشتر شبیه به مغز انسان هستند؛ سیستمهایی که بهمرور زمان سازگار میشوند، اطلاعات را بهطور انعطافپذیری پردازش میکنند و در مواقع نیاز به محاسبات عمیقتری روی میآورند. آنها همچنین به دنبال دستیابی به سطوح توانایی هستند که میتواند با عملکرد مغز انسان رقابت کند یا حتی از آن فراتر رود.
معماری CTM حول دو مکانیزم کلیدی شکل گرفته است. اول، هر نورون در مدل، یک تاریخچه کوتاه دارد که شامل زمان و علت فعالسازی است و این تاریخچه به تصمیمگیری در مورد زمان فعالسازی بعدی کمک میکند. دوم، همزمانی نورونی، چگونگی فعال شدن گروههای نورونهای مدل بهطور طبیعی و بر اساس هماهنگی داخلی است. این همزمانیها برای تنظیم توجه و تولید خروجیها استفاده میشوند و توجه به مناطقی که نورونهای بیشتری فعالند، معطوف میشود.
در آزمایشها شامل دستهبندی تصویر، حل معماهای ۲ بعدی و یادگیری تقویتی، CTMها هم تطابق و هم توانایی را نشان دادهاند. این مراحل داخلی “تفکر” به محققین اجازه میدهد تا تصمیمگیریها را در طول زمان مشاهده کنند و این شفافیت، در مقایسه با دیگر خانوادههای مدل، نادر است.
در حالی که CTMها هنوز در مراحل آزمایشی هستند و نیاز به بهینهسازی برای استفاده تجاری دارند، ساکنا پایهای قوی برای پذیرش جامعه ایجاد کرده است. تمام پیادهسازی CTM بهطور منبع باز در گیتهاب منتشر شده و اسکریپتهای آموزشی مخصوص، چکپوینتهای آموزشی از پیش تعیین شده و ابزارهای تحلیلی را شامل میشود.
ساکنا بهزودی گزارش اصلاحات و نتایج پژوهش خود را ارائه خواهد کرد و در عین حال به اعتراف به مشکلات پیش آمده در ارزیابیهای قبلی، مقامات را به شفافیت و بهبود سیستمهای هوش مصنوعی فراخوانده است. این رویکرد نشاندهنده تعهد ساکنا به ادغام محاسبات تکاملی با یادگیری ماشین مدرن است و رویای ایجاد مدلهایی که بهطور زمانبندی و قابل تطبیق عمل میکنند را ترویج میدهد.
نتیجهگیری اینکه، اگرچه CTMها در حال حاضر بهطور کامل برای جایگزینی ترنسفورمرها آماده نیستند، اما نمایانگر یک دسته جدید از مدلها با قابلیتهای نوآورانه هستند و میتوانند در آینده تحولی در صنعت هوش مصنوعی ایجاد کنند.