في عصر التطور السريع لوكلاء [نماذج [اللغة](/tag/اللغة) الكبيرة](/tag/[نماذج](/tag/نماذج)-[اللغة](/tag/اللغة)-الكبيرة) (Large Language [Models](/tag/models))، تبرز الحاجة إلى تكامل [أنظمة](/tag/أنظمة) [تفاعلية](/tag/تفاعلية) متعددة [النماذج](/tag/النماذج) في بنية موحدة. في هذا السياق، تأتي [الدراسة](/tag/الدراسة) الأخيرة لتناقش ثلاثة أنماط رئيسية لتفاعل الوكلاء، وهي: [تنسيق الوكلاء](/tag/[تنسيق](/tag/تنسيق)-[الوكلاء](/tag/الوكلاء)) المتعددين (Generator-Evaluator)، حلقات استخدام [الأدوات](/tag/الأدوات) (ReAct Tool-Use Loops)، والتفاعل المعزز بالذاكرة (Memory-Augmented Interaction)، كما هو متطبق في buddyMe، إطار [برمجة](/tag/برمجة) [الوكلاء](/tag/الوكلاء) متعدد [النماذج](/tag/النماذج) من [المصادر المفتوحة](/tag/المصادر-المفتوحة).
تقدم هذه [الدراسة](/tag/الدراسة) تحليلًا ممنهجًا يعتمد على خمس مراحل رئيسية تشمل: مراجعة المتطلبات الأولية (Requirement Pre-Review)، [تحليل](/tag/تحليل) المهام (Task Decomposition)، [تنفيذ](/tag/تنفيذ) ReAct (ReAct Execution)، [التحقق](/tag/التحقق) من التنفيذ الحقيقي (Real-Execution Verification)، ومناقشة [التقييم](/tag/التقييم) المعاكس (Adversarial [Evaluation](/tag/evaluation) Discussion).
لقد تم [تطوير](/tag/تطوير) نظام [تقييم](/tag/تقييم) يتميز بستة أبعاد مع درجات وزن مختلفة. بناءً على أربع [دراسات حالة](/tag/[دراسات](/tag/دراسات)-حالة) تجريبية مستندة إلى سجلات [نشر](/tag/نشر) حقيقية تشمل [توليد](/tag/توليد) دليل المتاحف، مهام [الطقس](/tag/الطقس) المجدولة، وتخطيط الجولات الشاملة، تم التوصل إلى ثلاث نتائج رئيسية:
1. تكشف مراجعة Generato-Evaluator عن نقص في المتطلبات في 20% من المهام المعقدة، بينما تجتاز 80% من المهام الفحص الأولي.
2. تضمن حلقة ReAct [تنفيذ المهام](/tag/[تنفيذ](/tag/تنفيذ)-المهام) الفرعية بشكل مستقر، لكنها تؤدي إلى حوالي 30% من الاستدعاءات الزائدة للأدوات.
3. تصل المناقشات بين القيم المعاكس والمدافع إلى [توافق](/tag/توافق) في غضون 2-3 جولات في ما يقرب من 70% من السيناريوهات، وتعمل بشكل أساسي على [تحسين](/tag/تحسين) المحتوى بدلاً من التراجع المنطقي.
كما نقوم بتقديم ثلاثة [مخططات](/tag/مخططات) [معمارية](/tag/معمارية) مستندة إلى Mermaid وإجراء مقارنات بين [النماذج](/tag/النماذج) مع CrewAI وAutoGen وLangGraph وMemGPT وA-Mem [عبر](/tag/عبر) ستة أبعاد نظامية. تقدم نتائج [البحث](/tag/البحث) إرشادات [تصميم](/tag/تصميم) عملية لبناء [أنظمة](/tag/أنظمة) [وكلاء](/tag/وكلاء) موثوقة ومتعددة [النماذج](/tag/النماذج).
استكشاف تفاعلات الوكلاء متعددة النماذج: تحليل شامل لأنظمة الذكاء الاصطناعي
تتناول هذه المقالة تحليلًا شاملًا لتفاعلات وكالات الذكاء الاصطناعي المتعددة النماذج في إطار ولكن متقلب. تكشف النتائج عن مفاتيح لبناء أنظمة وكلاء متينة وموثوقة.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
