MRAgent يخفض استهلاك وكلاء الذاكرة الطويلة إلى 118 ألف رمز في اختبارات معيارية
طور باحثون في الجامعة الوطنية في سنغافورة MRAgent لإعادة بناء الذاكرة عبر رسم Cue-Tag-Content، مع نقل VentureBeat لاستخدام LongMemEval نحو 118 ألف رمز لكل عينة مقابل 632 ألفا في A-Mem و3.26 مليون في LangMem.

MRAgent يعيد بناء الذاكرة أثناء الاستدلال
تقول VentureBeat إن باحثين في الجامعة الوطنية في سنغافورة طوروا MRAgent، وهو إطار ذاكرة لوكلاء الذكاء الاصطناعي يستبدل خطوط الاسترجاع الثابتة ثم الاستدلال بإعادة بناء ديناميكية للذاكرة. يسمح الإطار للوكيل بتطوير مسار الذاكرة أثناء جمع الأدلة، بدلا من تحميل نتائج استرجاع واسعة في سياق النموذج منذ البداية.
توضح VentureBeat أن خطوط الاسترجاع التقليدية عبر البحث المتجهي أو الرسوم البيانية قد تفشل في المهام طويلة الأفق لأن النظام لا يستطيع تعديل استراتيجية البحث أثناء الاستدلال. فإذا عثر الوكيل على إشارة ناقصة، مثل تاريخ أو شخص أو مكان، لا تملك خطوط الاسترجاع السلبية طريقة لإصدار استعلام جديد بناء على هذا الاكتشاف. كما يمكن لدرجات التشابه الثابتة أن تعيد تطابقات سطحية تملأ نافذة السياق بمواد غير ذات صلة.
بنية Cue-Tag-Content تضيق مسار البحث
يتعامل MRAgent مع الذاكرة كبيئة تفاعلية. يستكشف النموذج الأساسي مسارات استرجاع مرشحة عبر رسم ذاكرة منظم، ويقيم الأدلة الوسيطة، ويستنتج قيودا جديدة، ويستبعد الفروع التي لا تساعد في الإجابة عن الاستعلام.
ينظم الإطار الذاكرة عبر آلية Cue-Tag-Content. تمثل Cues كلمات مفتاحية دقيقة أو سمات سياقية، وتحفظ Content وحدات الذاكرة، بينما تلخص Tags العلاقات بين الإشارات والمحتوى. وتقول VentureBeat إن ذلك يسمح للنموذج بتقييم ملخصات علاقات قصيرة قبل إنفاق الرموز على محتويات ذاكرة أكبر.
يوضح الباحثون تدفق الاسترجاع بمثال عن سؤال حول كيفية استخدام Nate أموال جائزة بعد فوزه في بطولة ألعاب فيديو. يبدأ السؤال بإشارات مثل Nate والبطولة والفوز. يتبع MRAgent الوسم المرتبط بالفوز، ويستبعد ذكريات بطولة أقل صلة، ويضيف أرباح البطولة كإشارة جديدة، ويواصل البحث حتى يجمع أدلة كافية للإجابة.
LongMemEval يظهر استخدام 118 ألف رمز في الطلب
اختبر الباحثون MRAgent على LoCoMo وLongMemEval مقابل RAG القياسي وA-Mem وMemoryOS وLangMem وMem0. وتفيد معايير الورقة التي نقلتها VentureBeat بأن MRAgent تفوق على كل خطوط الأساس عبر النموذجين وكل أنواع الأسئلة.
في اختبارات LongMemEval التي نقلتها VentureBeat، استخدم MRAgent نحو 118 ألف رمز إدخال لكل عينة. واستهلك A-Mem نحو 632 ألف رمز، بينما استخدم LangMem نحو 3.26 مليون رمز لكل استعلام. وانخفض زمن التشغيل من 1,122 ثانية إلى 586 ثانية مقارنة مع A-Mem.
بناء الذاكرة يبقى عبء النشر
لا يزال الإطار يتطلب تجهيز بنية Cue-Tag-Content قبل وقت الاستعلام. يحتاج المطورون إلى بناء خط إدخال يعالج سجلات التفاعل الخام، ويستخرج البيانات الوصفية، ويخزن النتيجة في قاعدة بيانات رسومية.
صمم المؤلفون مرحلة البناء لاستخدام نماذج اللغة الكبيرة في التقطير الآلي بدلا من الوسم اليدوي. ولا يزال التنفيذ يتطلب وظائف خلفية وقوالب توجيه وتخزينا بيانيا قبل وقت الاستعلام. نشر المؤلفون الشفرة على GitHub، لكن عمليات النشر الإنتاجية المسماة وتكاليف الصيانة والتحقق من العملاء لا تزال غير معلنة.
















