في عالم الذكاء الاصطناعي المتطور باستمرار، يأتي مشروع CalBench كخطوة مبتكرة تهدف إلى تقييم التنسيق بين الوكلاء المتعددين عبر جدولة المواعيد. في CalBench، يقوم عدد من الوكلاء (N agents) بإدارة تقاويم خاصة تحتوي على التزامات مسبقة، ويتوجب عليهم التعاون لتحديد مواعيد لمجموعة من الاجتماعات الواردة (M incoming meetings) مع تقليل تكاليف التعطيل إلى الحد الأدنى.
لأن الوكلاء يمكنهم فقط رؤية تقاويمهم الخاصة، فإن النجاح في جدولة هذه الاجتماعات يتطلب تواصلاً فعّالاً عبر حدود المعلومات الخاصة. يتم توليد كل سيناريو في CalBench مع وجود حل مثالي، مما يُمَكِّن الباحثين من قياس جودة التنسيق بدقة من خلال قياسات التكاليف المحققة مقابل المُثلى، بالإضافة إلى استخدام معيار لتحسين القيود (Distributed Constraint Optimization - DCOP) لتقديم مقارنة عادلة تحت نفس قيود المعلومات الخاصة.
تسمح هذه البيئة بإجراء تحقق دقيق من نجاح المهام وكفاءة التواصل، فضلاً عن عدالة توزيع تكاليف التعطيل. كما تدرس كيفية الحفاظ على الخصوصية أثناء التنسيق من خلال إضافة سياقات دلالية خاصة لمواعيد الجدول، وقياس ما إذا كان الوكلاء يكشفون عن معلومات خاصة غير مرتبطة بالمهام أثناء التفاوض.
على عكس معايير الوكلاء المتعددين حيث يمكن لوكيل واحد قادر غالباً أن يحل محل المجموعة، فإن CalBench يتميز بكونه غير مركزي: فلا يمكن لأي وكيل الوصول إلى التقويم الخاص بوكيل آخر، ومع ذلك يجب على الوكلاء الوصول إلى قرارات متسقة مشتركة بشأن جدولة الاجتماعات. يتيح CalBench إذن بيئة عملية وقابلة للتحقق لدراسة بروتوكولات التنسيق وكفاءة التواصل واستراتيجيات التفاوض، وكذلك تقييم العدالة وتسرب معلومات الخصوصية في نظم الوكلاء المتعددة.
ما رأيكم في هذا التطور؟ شاركونا في التعليقات.
كال بنش: دراسة توازن الخصوصية والتنسيق في نماذج متعددة الوكلاء
تم تقديم بيئة تقييم مخصصة تُعرف بـ CalBench لدراسة التنسيق بين الوكلاء المتعددين من خلال جدولة المواعيد. يركز هذا النظام على توازن الخصوصية وكفاءة التواصل بين الوكلاء، مما يفتح آفاقاً جديدة في فهم نظم الذكاء الاصطناعي.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
