في عالم الذكاء الاصطناعي، شهدنا تزايدًا ملحوظًا في نجاح أسراب الوكلاء، مما غير مفهوم العمل بين النماذج اللغوية الكبيرة (LLMs) من أنظمة وكيل واحد إلى أنظمة متعددة الوكلاء. يبرز هنا أهمية تنسيق الوكلاء لتحقيق تقسيم المهام والتعاون المثمر. لكن، تأتي التحديات مع إطار العمل الحالي الذي يقتصر على مجموعة ضيقة من الأنماط (modalities) ولا يستطيع مجابهة المشاهد الأكثر تعقيدًا حيث تتفاعل أنماط متنوعة معًا.

تستعرض دراسة جديدة تم تقديمها مؤخرًا على منصة arXiv، إطار عمل مبتكر يُعنى بتنسيق الوكلاء يسمي Orchestra-o1. تم تصميم هذا النظام لدعم التعاون الفعال بين الوكلاء عبر أنماط البيانات المتعددة، كالنصوص، والصور، والصوتيات، والفيديو.

تم تقديم آلية تنسيق موحدة تتيح تقسيم المهام بتوعية بالنمط، وتخصص فرعي للوكلاء على الإنترنت، وتنفيذ المهام الفرعية بشكل متوازي. هذه التصميم القابل للتوسع يمكّن أنظمة الوكلاء من التعامل بفعالية مع المهام المعقدة في العالم الحقيقي، مقدّمًا أداءً أفضل بنسبة 10.3% في دقة النتائج مقارنة بأفضل الحلول المتاحة، وذلك وفقًا لمعيار OmniGAIA.

علاوة على ذلك، تم إدخال أسلوب جديد يُدعى تحسين سياسة المجموعة المتزامنة محسوبة القرار (DA-GRPO)، والذي يعد نهجًا فعالًا للتعلم المعزز للوكلاء ويحقق أداءً متميزًا مقارنة بجميع الوكلاء المتعددين الأنماط المتاحة مفتوحة المصدر.