في عصر التطور السريع لوكلاء نماذج اللغة الكبيرة (Large Language Models)، تبرز الحاجة إلى تكامل أنظمة تفاعلية متعددة النماذج في بنية موحدة. في هذا السياق، تأتي الدراسة الأخيرة لتناقش ثلاثة أنماط رئيسية لتفاعل الوكلاء، وهي: تنسيق الوكلاء المتعددين (Generator-Evaluator)، حلقات استخدام الأدوات (ReAct Tool-Use Loops)، والتفاعل المعزز بالذاكرة (Memory-Augmented Interaction)، كما هو متطبق في buddyMe، إطار برمجة الوكلاء متعدد النماذج من المصادر المفتوحة.

تقدم هذه الدراسة تحليلًا ممنهجًا يعتمد على خمس مراحل رئيسية تشمل: مراجعة المتطلبات الأولية (Requirement Pre-Review)، تحليل المهام (Task Decomposition)، تنفيذ ReAct (ReAct Execution)، التحقق من التنفيذ الحقيقي (Real-Execution Verification)، ومناقشة التقييم المعاكس (Adversarial Evaluation Discussion).

لقد تم تطوير نظام تقييم يتميز بستة أبعاد مع درجات وزن مختلفة. بناءً على أربع دراسات حالة تجريبية مستندة إلى سجلات نشر حقيقية تشمل توليد دليل المتاحف، مهام الطقس المجدولة، وتخطيط الجولات الشاملة، تم التوصل إلى ثلاث نتائج رئيسية:

1. تكشف مراجعة Generato-Evaluator عن نقص في المتطلبات في 20% من المهام المعقدة، بينما تجتاز 80% من المهام الفحص الأولي.
2. تضمن حلقة ReAct تنفيذ المهام الفرعية بشكل مستقر، لكنها تؤدي إلى حوالي 30% من الاستدعاءات الزائدة للأدوات.
3. تصل المناقشات بين القيم المعاكس والمدافع إلى توافق في غضون 2-3 جولات في ما يقرب من 70% من السيناريوهات، وتعمل بشكل أساسي على تحسين المحتوى بدلاً من التراجع المنطقي.

كما نقوم بتقديم ثلاثة مخططات معمارية مستندة إلى Mermaid وإجراء مقارنات بين النماذج مع CrewAI وAutoGen وLangGraph وMemGPT وA-Mem عبر ستة أبعاد نظامية. تقدم نتائج البحث إرشادات تصميم عملية لبناء أنظمة وكلاء موثوقة ومتعددة النماذج.