في عالم الذكاء الاصطناعي، يبرز التعلم المعزز اللفظي (Verbal Reinforcement Learning) كأحد التقنيات المتقدمة التي تمكن الوكلاء الذكاء الاصطناعي من التعلم من ردود الفعل البيئية. تعتمد هذه التقنية على استخراج القواعد اللفظية من الخبرات الموجودة دون الحاجة إلى عملية تدريب تقليدية، مما يجعلها مثيرة للاهتمام في سياقات متعددة مثل التنبؤ بالسوق أو التوقعات الاقتصادية.

ومع ذلك، يواجه هؤلاء الوكلاء تحديًا كبيرًا في البيئات غير الثابتة، والمعروف باسم معضلة الاحتفاظ والنسيان. فتخزين رؤى قديمة يمكن أن يؤدي إلى نقل سلبي للمعرفة، في حين أن التخلص منها قد يسبب نسيان كارثي للمعرفة عند تكرار الظروف. لتجاوز هذا التحدي، حددت الدراسة أربعة متطلبات ضرورية هي: تقييم قائم على النتائج، وأدلة منظمة دائمة، ودورة حياة معرفة غير خطية، وإدارة تركيبية.

كما اقترحت الدراسة نموذجًا من ثلاثة طبقات؛ القواعد، والأدلة، والمهارات. ترتبط هذه الطبقات بدائرة تنظيمية تعتمد على التغذية الراجعة، مما يغلق الفجوة في إدارة المعرفة. حيث تستخلص القواعد التجارب من نتائج العالم، وتقوم الأدلة بتسجيل موثوقية كل قاعدة عبر الحلقات الزمنية، بينما تحدد المهارات القواعد التي ينبغي تطبيقها وكيفية حل النزاعات.

تم إجراء دراسة حالة على التنبؤ المالي، حيث تم ملاحظة أن الخبرة المتراكمة يمكن أن تؤدي إما إلى تدهور الأداء أو تحسين دقيق للعوائد، اعتمادًا على وجود دائرة التنظيم.

تشير النتائج إلى أهمية إدارة الرؤى بشكل فعال في تعزيز الأداء في البيئات الديناميكية وغير الثابتة، مما يفتح آفاق جديدة في تطبيقات الذكاء الاصطناعي.