يواجه الوكلاء المعتمدون على نماذج اللغة الكبيرة (Large Language Models) العديد من التحديات عند أداء المهام التي تتطلب التفاعل المنطقي، واستخدام الأدوات، والتعامل مع البيئات المعقدة. وغالباً ما تُسجل هذه الإخفاقات دون تحليل كافٍ، مما يحرمنا من الاستفادة من المعلومات القيمة المخزنة فيها.

في هذا السياق، تم تقديم CausalFlow كإطار تدخل مبتكر يهدف إلى تحويل سجلات أداء الوكلاء الفاشلة إلى تصحيحات فعالة وقابلة للاستخدام. يعتمد CausalFlow على نمذجة مسارات التنفيذ كسلاسل متتابعة من الخطوات المعتمدة، ويقوم بحساب درجات المسؤولية السببية (Causal Responsibility Scores) من خلال التدخلات التخيلية الخطوة بخطوة لتحديد الخطوات المسببة للفشل.

يعمل هذا الإطار بشكل مزدوج: فهو يتيح تصحيح الأخطاء في الوقت الفعلي بتدخلات محددة، مما يساعد الوكلاء على التعافي من الإخفاقات دون تغيير سلوكهم بشكل ملحوظ، كما يوفر إشرافًا في وقت التدريب يمكن استخدامه في تحسين تفضيلات التعلم أو نمذجة المكافآت.

عبر أربعة معايير متعددة بما في ذلك الاستدلال الرياضي، وتوليد الشيفرات، والإجابة على الأسئلة، والتصفح الطبي، أثبت CausalFlow قدرته على تحويل حالات الفشل إلى تصحيحات موثوقة مع تحقيق درجات عالية من القابلية للتحقيق وتوافق السببية. وأصبح من الواضح أن نسبة التحديد السببي ضرورية لتحسين موثوقية الأداء عبر المهام المتنوعة، متفوقاً بذلك على تقنيات التحسين العشوائية.

تُظهر هذه النتائج أن التحليل التداخلي على مسارات التنفيذ المنظمة يوفر آلية موثوقة وقابلة للتطوير لتحويل إخفاقات الوكلاء إلى مكاسب في الموثوقية وتوجيهات جاهزة للتعلم.