في عالم الذكاء الاصطناعي المعاصر، تلعب نماذج اللغات الكبيرة (Large Language Models) دورًا محوريًا في تطوير مناهج استنتاج متعددة المسارات، خاصة في إستخدام الأدوات. وقد أظهرت الأبحاث الجديدة فوائد استخدام الذاكرة في هذه النماذج، حيث يتمكن الوكلاء من توليد محاولات استدلال متعددة واختيار الأنسب منها. التحدي الأكبر يكمن في استغلال المعرفة المكتسبة عبر هذه المحاولات بطريقة تسمح لاحقًا بتجنب الأخطاء السابقة.

تسعى الدراسة الجديدة، التي تم الإعلان عنها في arXiv، إلى تقديم إطار عمل موحد يهدف إلى حل بعض من العوائق التي تعترض فهم كيفية تأثير الذاكرة على استنتاجات أدوات LLM. يتم تقسيم هذه الذاكرة إلى محورين: نطاق النقل (ضمن توسعة واحدة أو عبر مسارات متعددة) وتجريد المحتوى المنقول. ولقد تم تقييم أربع طرق تحت ثلاث استراتيجيات استنتاج (أفضل من N، بحث الحزمة، وبحث شجرة التوافق) على أربعة معايير تستخدم أدوات مثل SQL، ومخططات المعرفة، وبيئات CLI، في إعداد خالٍ من التحقق يتناسب مع أنظمة الوكلاء العملية.

تظهر النتائج بأن وسيلة الاستنتاج تلعب دورًا حاسمًا: فقد لوحظ أن نفس طريقة الذاكرة تعطي نتائج مختلفة بشكل إحصائي وفقًا لاستراتيجيات الاستنتاجية المستخدمة. بينما تصل وسيلة التأمل (reflection) إلى نتائج ذات دلالة فقط تحت استراتيجية بحث شجرة التوافق، فإن نقل المعلومات ضمن التوسعة (باستخدام نتائج الأشقاء السابقين لترتيب كل مرشح) يفيد فقط في البحث ذو التنوع المنخفض. بينما تبين أيضاً أن استخراج الحقائق الذرية (atomic fact extraction) لا يؤثر على الدقة ولكن يقلص طول المسارات بنسبة 19-26% في المهام التي تتضمن بنى بيئية قابلة لإعادة الاستخدام.

بشكل عام، تشير هذه النتائج إلى أن تصميم إستراتيجية الاستنتاج لا يمكن تجاهله عند التفكير في كيفية استغلال الذاكرة لتحسين الأداء في أدوات LLM. فما رأيكم في هذه التطورات؟ شاركونا في التعليقات.