در تازهترین پیشرفتهای حوزه هوش مصنوعی، محققان شرکت Mem0 دو معماری حافظه جدید با نامهای Mem0 و Mem0g را معرفی کردهاند که هدف آنها توانمندسازی مدلهای زبانی بزرگ (LLMs) برای حفظ مکالمات منسجم و پایدار در طول زمانهای طولانیتر است. این معماریها به گونهای طراحی شدهاند که قادر باشند اطلاعات کلیدی را بهطور دینامیک استخراج، جمعآوری و بازیابی کنند. ویژگی بارز این فناوری، نزدیکتر کردن حافظه هوش مصنوعی به حافظه انسانی است، بهویژه در مواردی که نیاز به یادآوری اطلاعات از تعاملات طولانی وجود دارد.
این نوآوری برای شرکتها و سازمانهایی که به دنبال بهکارگیری هوش مصنوعی قابل اعتماد در برنامههای خود هستند، اهمیت ویژهای دارد. تا کنون، مدلهای زبانی بزرگ تواناییهای شگفتانگیزی در تولید متن شبیه به انسان نشان دادهاند، اما محدودیتهای مربوط به «پنجرههای ثابت زمینه» مانع از حفظ انسجام در روابط طولانیمدت یا مکالمات چند جلسهای میشود. محققان Mem0 تاکید میکنند که حتی پنجرههای زمینهای که به میلیونها توکن میرسند، دو دلیل اساسی را بهعنوان چالشهای اساسی در این حوزه مطرح میکنند.
تیم Mem0 در پژوهشهای خود دریافته که بسیاری از سیستمهای هوش مصنوعی تولیدی نمیتوانند در مدیریت حافظه خود به خوبی عمل کنند. بهعنوان مثال، رباتهای پشتیبانی مشتری ممکن است درخواستهای بازپرداخت قبلی را فراموش کنند یا نیاز به ورود دوباره جزئیات سفارش هر بار داشته باشند. این ناکامیها ناشی از رویکردهای محدود حافظه و روشهای سادهی بازیابی اطلاعات هستند که عملکرد آنها را تحت تأثیر قرار میدهند.
در مقاله خود، محققان به این نکته اشاره میکنند که یک حافظه هوش مصنوعی قوی باید بتواند بهطور انتخابی اطلاعات مهم را ذخیره کرده، مفاهیم مرتبط را یکپارچهسازی کرده و جزئیات مرتبط را در زمان نیاز بازیابی کند؛ این فرایند مشابه با روشهای شناختی انسان است. در این راستا، Mem0 توانایی استخراج و سازماندهی اطلاعات مرتبط از مکالمات جاری را دارد. این سیستم شامل دو فاز اصلی است: استخراج و بهروزرسانی.
فاز استخراج با پردازش یک جفت پیام جدید (معمولاً پیام کاربر و پاسخ دستیار هوش مصنوعی) آغاز میشود. سیستم با افزودن اطلاعات از دو منبع—ترتیب پیامهای اخیر و خلاصه کل مکالمه—به این مرحله ورود میکند. Mem0 با استفاده از یک ماژول تولید خلاصه غیرهمزمان، بهطور دورهای خلاصه مکالمه را در پسزمینۀ خود بهروز میکند.
در این میان، فاز بهروزرسانی اطلاعات جدید استخراجشده را با حافظههای موجود مقایسه میکند. Mem0 میتواند با استفاده از قابلیتهای استدلال خود، تصمیم بگیرد که آیا اطلاعات جدید را به حافظه اضافه کند، حافظه موجود را بهروز کند، حافظهای را حذف کند یا هیچ اقدامی نکند.
با استفاده از Mem0g، که نسخهای بهبود یافته از Mem0 است، مدلها توانایی بهتری در تجزیه و تحلیل روابط پیچیده بین اطلاعات مکالمه دارند. این مدل با نمایههای حافظه مبتنی بر گراف، بهطور مؤثری اطلاعات را به هم متصل میکند.
محققان این فناوری را در ارزیابیهای جامع روی معیار LOCOMO، که مخصوص آزمون حافظه مکالمهای طولانیمدت طراحی شده، مورد آزمایش قرار دادند و نتایج نشان داد که Mem0 و Mem0g بهطور مداوم از سیستمهای حافظه موجود پیشی گرفتهاند.
در نهایت، Mem0 و Mem0g فرصتهای جدیدی را برای توسعه سیستمهای هوش مصنوعی مکالمهای ایجاد میکنند که قادر به یادآوری، یادگیری و توسعه بر اساس تعاملات گذشته هستند. این نوآوریها بهویژه در حوزههای مختلفی از جمله رباتهای گفتوگو، دستیارهای شخصی و دیگر کاربردهای هوش مصنوعی مدرن قابل استفاده هستند و به افزایش کارایی و دقت در درخواستهای کاربران کمک میکنند.