به گزارش سایت بینا ویرا، استارتاپ هوش مصنوعی ساكنا مستقر در توکیو، که به‌دست دانشمندان برجسته سابق گوگل تأسیس شده است، از معماری جدیدی به نام ماشین‌های تفکر پیوسته (CTM) رونمایی کرده است. CTMها به‌گونه‌ای طراحی شده‌اند که نسل جدیدی از مدل‌های زبان هوش مصنوعی را ارائه دهند که قابلیت‌های بیشتری برای انجام وظایف شناختی پیچیده مانند حل معماهای پیچیده یا انجام کارهای حرکتی بدون نیاز به نشانه‌های موقعیتی داشته باشند، و به شکل‌گیری روش‌های استدال انسانی نزدیک‌تر شوند.

بر خلاف مدل‌های ترنسفورمر که داده‌ها را به‌صورت همزمان پردازش می‌کنند، CTMها محاسبات را در مراحل داخلی واحدهای ورودی/خروجی، که به آن “نورون‌های مصنوعی” گفته می‌شود، گسترش می‌دهند. هر نورون در این مدل، تاریخچه‌ای از فعالیت‌های قبلی خود را حفظ می‌کند و از این حافظه برای تصمیم‌گیری درباره زمان فعال‌سازی مجدد استفاده می‌کند. این ساختار داخلی اضافه به CTMها امکان می‌دهد تا عمق و مدت استدلال خود را بر اساس پیچیدگی وظایف به‌صورت دینامیکی تنظیم کنند.

کاغذی که به توصیف این فناوری پرداخته است، به‌صورت عمومی در نشریه arXiv منتشر شده و شامل یک میکروسایت و یک مخزن گیت‌هاب برای سهولت دسترسی به این اطلاعات است. اکثر مدل‌های زبان بزرگ (LLM) امروزی همچنان بر اساس معماری “ترنسفورمر” بنا شده‌اند که در مقاله کلیدی ۲۰۱۷ پژوهشگران گوگل برین ارائه شده است. این مدل‌ها با استفاده از لایه‌های ثابت سطح عمق، ورودی‌ها را در یک بار پردازش می‌کنند، در حالی که CTMها به هر نورون اجازه می‌دهند که بر اساس زمان داخلی خود عمل کند و تصمیمات فعال‌سازی را بر مبنای حافظه کوتاه‌مدت خود اتخاذ کنند.

ساکنا معتقد است که CTMها گامی به سوی هوش بیشتر شبیه به مغز انسان هستند؛ سیستم‌هایی که به‌مرور زمان سازگار می‌شوند، اطلاعات را به‌طور انعطاف‌پذیری پردازش می‌کنند و در مواقع نیاز به محاسبات عمیق‌تری روی می‌آورند. آنها همچنین به دنبال دستیابی به سطوح توانایی هستند که می‌تواند با عملکرد مغز انسان رقابت کند یا حتی از آن فراتر رود.

معماری CTM حول دو مکانیزم کلیدی شکل گرفته است. اول، هر نورون در مدل، یک تاریخچه کوتاه دارد که شامل زمان و علت فعال‌سازی است و این تاریخچه به تصمیم‌گیری در مورد زمان فعال‌سازی بعدی کمک می‌کند. دوم، هم‌زمانی نورونی، چگونگی فعال شدن گروه‌های نورون‌های مدل به‌طور طبیعی و بر اساس هماهنگی داخلی است. این هم‌زمانی‌ها برای تنظیم توجه و تولید خروجی‌ها استفاده می‌شوند و توجه به مناطقی که نورون‌های بیشتری فعالند، معطوف می‌شود.

در آزمایش‌ها شامل دسته‌بندی تصویر، حل معماهای ۲ بعدی و یادگیری تقویتی، CTMها هم تطابق و هم توانایی را نشان داده‌اند. این مراحل داخلی “تفکر” به محققین اجازه می‌دهد تا تصمیم‌گیری‌ها را در طول زمان مشاهده کنند و این شفافیت، در مقایسه با دیگر خانواده‌های مدل، نادر است.

در حالی که CTMها هنوز در مراحل آزمایشی هستند و نیاز به بهینه‌سازی برای استفاده تجاری دارند، ساکنا پایه‌ای قوی برای پذیرش جامعه ایجاد کرده است. تمام پیاده‌سازی CTM به‌طور منبع باز در گیت‌هاب منتشر شده و اسکریپت‌های آموزشی مخصوص، چک‌پوینت‌های آموزشی از پیش تعیین شده و ابزارهای تحلیلی را شامل می‌شود.

ساکنا به‌زودی گزارش اصلاحات و نتایج پژوهش خود را ارائه خواهد کرد و در عین حال به اعتراف به مشکلات پیش آمده در ارزیابی‌های قبلی، مقامات را به شفافیت و بهبود سیستم‌های هوش مصنوعی فراخوانده است. این رویکرد نشان‌دهنده تعهد ساکنا به ادغام محاسبات تکاملی با یادگیری ماشین مدرن است و رویای ایجاد مدل‌هایی که به‌طور زمان‌بندی و قابل تطبیق عمل می‌کنند را ترویج می‌دهد.

نتیجه‌گیری اینکه، اگرچه CTMها در حال حاضر به‌طور کامل برای جایگزینی ترنسفورمرها آماده نیستند، اما نمایانگر یک دسته جدید از مدل‌ها با قابلیت‌های نوآورانه هستند و می‌توانند در آینده تحولی در صنعت هوش مصنوعی ایجاد کنند.

مشاور دیجیتال هوشمند

دیدگاه‌ خود را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

اسکرول به بالا