في عصر الذكاء الاصطناعي المتقدم، تلعب وكالات نماذج اللغات الضخمة (LLM) دورًا متزايد الأهمية في حل المهام المعقدة. تعتمد هذه الوكالات على التفاعل مع مجموعة متنوعة من الأدوات، وأنظمة الاسترجاع، ووحدات الذاكرة، والبيئات المختلفة، مما يوسع من نطاق استقلاليتها. لكن هذه القدرات الجديدة تأتي بتحديات تتعلق بالتحقق من سلوك الوكلاء وضبطه وتدقيقه.

ليس من الكافي الاعتماد فقط على دقة الإجابات النهائية، بل يجب فهم كيفية إنتاج هذه المخرجات وما هي الأدلة التي دعمت كل ادعاء. لذلك، يأتي دور تتبع الأدلة وأصول التنفيذ ليعالج هذا النقص. من خلال نمذجة العلاقات بين الأدلة المسترجعة، والمخرجات من الأدوات، والملاحظات من البيئة، والادعاءات الوسيطة، يمكننا تعزيز الشفافية في طريقة تنفيذ الوكالات.

تشمل مجالات البحث الحالية أطرًا مفاهيمية لتتبع الأدلة وأصول التنفيذ في وكالات نماذج اللغات الضخمة، مما يرتكز على نظرة شاملة تربط بين الاسترجاع، ودعم الادعاءات، وسلامة استخدام الأدوات، وغير ذلك. كما تم تقديم تصنيف يغطي مصادر التتبع، ووحدات الأدلة والتنفيذ، وعلاقات الأصول.

نستعرض أيضًا الاتجاهات المنهجية الرئيسية، مثل تمثيل الأصول، وإسناد الأدلة، ووسائل الأمان المرتبطة بالتنفيذ، فضلاً عن التشخيص في حالة الفشل. ومع ذلك، فإن هناك العديد من التحديات المفتوحة التي تحتاج إلى معالجة، مثل تطوير مخططات تتبع موحدة، وآليات سلامة مدروسة، وهيكلية تدقيق تراعي الخصوصية.

باختصار، يتجه البحث نحو تعزيز المساءلة على مستوى العمليات بدلاً من الاعتماد فقط على دقة الإجابات النهائية، وهو ما قد يحدث تحولاً جذريًا في كيفية الاعتماد على نماذج اللغات الضخمة في المستقبل.