في عصر التطور السريع لوكلاء [نماذج [اللغة](/tag/اللغة) الكبيرة](/tag/[نماذج](/tag/نماذج)-[اللغة](/tag/اللغة)-الكبيرة) (Large Language [Models](/tag/models))، تبرز الحاجة إلى تكامل [أنظمة](/tag/أنظمة) [تفاعلية](/tag/تفاعلية) متعددة [النماذج](/tag/النماذج) في بنية موحدة. في هذا السياق، تأتي [الدراسة](/tag/الدراسة) الأخيرة لتناقش ثلاثة أنماط رئيسية لتفاعل الوكلاء، وهي: [تنسيق الوكلاء](/tag/[تنسيق](/tag/تنسيق)-[الوكلاء](/tag/الوكلاء)) المتعددين (Generator-Evaluator)، حلقات استخدام [الأدوات](/tag/الأدوات) (ReAct Tool-Use Loops)، والتفاعل المعزز بالذاكرة (Memory-Augmented Interaction)، كما هو متطبق في buddyMe، إطار [برمجة](/tag/برمجة) [الوكلاء](/tag/الوكلاء) متعدد [النماذج](/tag/النماذج) من [المصادر المفتوحة](/tag/المصادر-المفتوحة).

تقدم هذه [الدراسة](/tag/الدراسة) تحليلًا ممنهجًا يعتمد على خمس مراحل رئيسية تشمل: مراجعة المتطلبات الأولية (Requirement Pre-Review)، [تحليل](/tag/تحليل) المهام (Task Decomposition)، [تنفيذ](/tag/تنفيذ) ReAct (ReAct Execution)، [التحقق](/tag/التحقق) من التنفيذ الحقيقي (Real-Execution Verification)، ومناقشة [التقييم](/tag/التقييم) المعاكس (Adversarial [Evaluation](/tag/evaluation) Discussion).

لقد تم [تطوير](/tag/تطوير) نظام [تقييم](/tag/تقييم) يتميز بستة أبعاد مع درجات وزن مختلفة. بناءً على أربع [دراسات حالة](/tag/[دراسات](/tag/دراسات)-حالة) تجريبية مستندة إلى سجلات [نشر](/tag/نشر) حقيقية تشمل [توليد](/tag/توليد) دليل المتاحف، مهام [الطقس](/tag/الطقس) المجدولة، وتخطيط الجولات الشاملة، تم التوصل إلى ثلاث نتائج رئيسية:

1. تكشف مراجعة Generato-Evaluator عن نقص في المتطلبات في 20% من المهام المعقدة، بينما تجتاز 80% من المهام الفحص الأولي.
2. تضمن حلقة ReAct [تنفيذ المهام](/tag/[تنفيذ](/tag/تنفيذ)-المهام) الفرعية بشكل مستقر، لكنها تؤدي إلى حوالي 30% من الاستدعاءات الزائدة للأدوات.
3. تصل المناقشات بين القيم المعاكس والمدافع إلى [توافق](/tag/توافق) في غضون 2-3 جولات في ما يقرب من 70% من السيناريوهات، وتعمل بشكل أساسي على [تحسين](/tag/تحسين) المحتوى بدلاً من التراجع المنطقي.

كما نقوم بتقديم ثلاثة [مخططات](/tag/مخططات) [معمارية](/tag/معمارية) مستندة إلى Mermaid وإجراء مقارنات بين [النماذج](/tag/النماذج) مع CrewAI وAutoGen وLangGraph وMemGPT وA-Mem [عبر](/tag/عبر) ستة أبعاد نظامية. تقدم نتائج [البحث](/tag/البحث) إرشادات [تصميم](/tag/تصميم) عملية لبناء [أنظمة](/tag/أنظمة) [وكلاء](/tag/وكلاء) موثوقة ومتعددة [النماذج](/tag/النماذج).