يواجه وكلاء الذكاء الاصطناعي المعتمدون على نماذج اللغات الضخمة (Large Language Models) تحديات كبيرة في الحفاظ على سلوك متماسك خلال فترات الحوار الطويلة، وذلك بسبب القيود المفروضة على السياق. في ظل هذا التحدي، أصبحت الطرق المعتمدة على تكنولوجيا RAG (Retrieval-Augmented Generation) أكثر شيوعًا، حيث تُخزن التفاعلات في وحدات ذاكرة خارجية وتُسترجع عند الحاجة. ولكن، تعتمد فعالية هذه الأساليب في الإجابة على الأسئلة المعقدة، مثل الأسئلة متعددة الخطوات وفهم العادات الشائعة، على قدرة الوكيل على التفكير في المعلومات المسترجعة.

تُظهر الطرق المتاحة حاليًا تكرارًا للتشابه الدلالي مع المدخلات الأولية للمستخدم، وهو ما يغفل التفكير الواضح بشأن الحقائق الوسيطة المفقودة. ومن هنا جاءت فكرة إطار Goal-Mem، الذي يركز على التفكير المستند إلى الأهداف ويعتمد على نماذج ذاكرة تفاعلية. يقوم هذا الإطار بفك أهداف المستخدم إلى أهداف فرعية معينة، مما يسمح باسترجاع معلومات مستهدفة تلبي كل هدف فرعي على حدة. إذا تعذر حل الأهداف الوسيطة، فإن Goal-Mem يستحدث؛ ما يجب استرجاعه من الذاكرة.

هذا النظام يتمّ من خلال منطق اللغة الطبيعية، الذي يجمع بين قابلية التحقق من التفكير المقدم من المنطق الرسمي (FOL) وبين قدرة اللغة الطبيعية على التعبير. وأثبتت التجارب المكثفة التي أُجريت على مجموعتين بيانات، والتي تم مقارنتها بتسعة قوالب ذاكرة قوية، أن Goal-Mem يُحسن الأداء بشكل مستمر، وبخاصة في المهام التي تتطلب التفكير متعدد الخطوات والاستنتاج الضمني.