MRAgent يخفض استهلاك وكلاء الذاكرة الطويلة إلى 118 ألف رمز في اختبارات معيارية

بقلممكتب الذكاء الاصطناعي والمؤسسات في SendTech Timesتغطية مكتبية محررة ومراجعة المصدر|المصدر: VentureBeat

موجز التحرير

طور باحثون في الجامعة الوطنية في سنغافورة MRAgent لإعادة بناء الذاكرة عبر رسم Cue-Tag-Content، مع نقل VentureBeat لاستخدام LongMemEval نحو 118 ألف رمز لكل عينة مقابل 632 ألفا في A-Mem و3.26 مليون في LangMem.

تمت المراجعة مقابل مواد المصدرتحرير مكتب الذكاء الاصطناعي والمؤسسات في SendTech Times

MRAgent يخفض استهلاك وكلاء الذاكرة الطويلة إلى 118 ألف رمز في اختبارات معيارية

مصدر الصورة: VentureBeat

MRAgent يعيد بناء الذاكرة أثناء الاستدلال

تقول VentureBeat إن باحثين في الجامعة الوطنية في سنغافورة طوروا MRAgent، وهو إطار ذاكرة لوكلاء الذكاء الاصطناعي يستبدل خطوط الاسترجاع الثابتة ثم الاستدلال بإعادة بناء ديناميكية للذاكرة. يسمح الإطار للوكيل بتطوير مسار الذاكرة أثناء جمع الأدلة، بدلا من تحميل نتائج استرجاع واسعة في سياق النموذج منذ البداية.

توضح VentureBeat أن خطوط الاسترجاع التقليدية عبر البحث المتجهي أو الرسوم البيانية قد تفشل في المهام طويلة الأفق لأن النظام لا يستطيع تعديل استراتيجية البحث أثناء الاستدلال. فإذا عثر الوكيل على إشارة ناقصة، مثل تاريخ أو شخص أو مكان، لا تملك خطوط الاسترجاع السلبية طريقة لإصدار استعلام جديد بناء على هذا الاكتشاف. كما يمكن لدرجات التشابه الثابتة أن تعيد تطابقات سطحية تملأ نافذة السياق بمواد غير ذات صلة.

بنية Cue-Tag-Content تضيق مسار البحث

يتعامل MRAgent مع الذاكرة كبيئة تفاعلية. يستكشف النموذج الأساسي مسارات استرجاع مرشحة عبر رسم ذاكرة منظم، ويقيم الأدلة الوسيطة، ويستنتج قيودا جديدة، ويستبعد الفروع التي لا تساعد في الإجابة عن الاستعلام.

ينظم الإطار الذاكرة عبر آلية Cue-Tag-Content. تمثل Cues كلمات مفتاحية دقيقة أو سمات سياقية، وتحفظ Content وحدات الذاكرة، بينما تلخص Tags العلاقات بين الإشارات والمحتوى. وتقول VentureBeat إن ذلك يسمح للنموذج بتقييم ملخصات علاقات قصيرة قبل إنفاق الرموز على محتويات ذاكرة أكبر.

يوضح الباحثون تدفق الاسترجاع بمثال عن سؤال حول كيفية استخدام Nate أموال جائزة بعد فوزه في بطولة ألعاب فيديو. يبدأ السؤال بإشارات مثل Nate والبطولة والفوز. يتبع MRAgent الوسم المرتبط بالفوز، ويستبعد ذكريات بطولة أقل صلة، ويضيف أرباح البطولة كإشارة جديدة، ويواصل البحث حتى يجمع أدلة كافية للإجابة.

LongMemEval يظهر استخدام 118 ألف رمز في الطلب

اختبر الباحثون MRAgent على LoCoMo وLongMemEval مقابل RAG القياسي وA-Mem وMemoryOS وLangMem وMem0. وتفيد معايير الورقة التي نقلتها VentureBeat بأن MRAgent تفوق على كل خطوط الأساس عبر النموذجين وكل أنواع الأسئلة.

في اختبارات LongMemEval التي نقلتها VentureBeat، استخدم MRAgent نحو 118 ألف رمز إدخال لكل عينة. واستهلك A-Mem نحو 632 ألف رمز، بينما استخدم LangMem نحو 3.26 مليون رمز لكل استعلام. وانخفض زمن التشغيل من 1,122 ثانية إلى 586 ثانية مقارنة مع A-Mem.

بناء الذاكرة يبقى عبء النشر

لا يزال الإطار يتطلب تجهيز بنية Cue-Tag-Content قبل وقت الاستعلام. يحتاج المطورون إلى بناء خط إدخال يعالج سجلات التفاعل الخام، ويستخرج البيانات الوصفية، ويخزن النتيجة في قاعدة بيانات رسومية.

صمم المؤلفون مرحلة البناء لاستخدام نماذج اللغة الكبيرة في التقطير الآلي بدلا من الوسم اليدوي. ولا يزال التنفيذ يتطلب وظائف خلفية وقوالب توجيه وتخزينا بيانيا قبل وقت الاستعلام. نشر المؤلفون الشفرة على GitHub، لكن عمليات النشر الإنتاجية المسماة وتكاليف الصيانة والتحقق من العملاء لا تزال غير معلنة.

#agentic memory #AI agents #MRAgent #RAG

مقالات ذات صلة

المزيد

الذكاء الاصطناعي

ميزة Conway من Anthropic تدفع Claude نحو وكلاء ذكاء اصطناعي دائمين

تستعد Anthropic لتوسيع Claude بميزات تشمل Conway وOrbit وOperon وترقيات الذاكرة ووضع الصوت متعدد اللغات، في إشارة إلى تحول من الدردشة إلى مساعدين دائمين قادرين على العمل عبر خدمات متصلة.

الذكاء الاصطناعي

حزمة NVIDIA Agent Toolkit تضيف ضوابط تشغيل بلا أعداد طرح

تجمع NVIDIA نماذج Nemotron المفتوحة ومخططات NemoClaw ودعم OpenShell runtime لوكلاء مؤسسيين متخصصين، لكنها لم تكشف الأسعار أو تواريخ النشر أو أعداد الطرح.

الذكاء الاصطناعي

Tencent تطرح وكيل WorkBuddy عالمياً ضمن دفعها لإنتاجية المؤسسات

أطلقت Tencent Cloud وكيل WorkBuddy للمستخدمين خارج الصين بعد طرحه محلياً. يستطيع المنتج تشغيل مهام عبر تطبيقات المراسلة والاتصال بأدوات عمل مثل GitHub وJira وGoogle Drive وGmail وNotion وSlack. كما طرحت الشركة Miora وTokenHub ضمن توسع أوسع في ذكاء المؤسسات.

السحابة ومراكز البيانات

إطار Eve من Vercel يختبر ما إذا كانت أدوات الوكلاء قادرة على الخروج من ظل الذكاء الاصطناعي غير المنضبط

طرحت Vercel إطار الوكلاء المفتوح المصدر eve وضوابط Passport لتطبيقات الذكاء الاصطناعي التي يطوّرها الموظفون، لتضع استراتيجية منصتها للمطورين في مواجهة مخاوف الشركات من الوكلاء غير المُدارين، وانكشاف البيانات، والزيادة في تكاليف السحابة.