مع تطور أنظمة الذكاء الاصطناعي الكبيرة متعددة الوكلاء (Large Scale Multi-Agent Systems)، أصبح بروتوكول الاتصال أحد العناصر الأساسية التي تؤثر على الأداء والموثوقية. ومع وجود مجموعة من البروتوكولات المتنوعة مثل A2A و ACP و ANP و Agora، يُعاني الكثيرون من عدم وجود توجيه موحد لاختيار البروتوكول الأنسب.

هنا يأتي دور ProtocolBench، لوحة القياس الثورية التي تقدم مقارنة منهجية بين بروتوكولات الوكلاء استناداً إلى أربعة محاور قابلة للقياس: نجاح المهمة، زمن الانتقال بين الأطراف، تكلفة الرسائل أو النبضات، والقدرة على التحمل في ظروف الفشل.

وقد أظهرت النتائج أن اختيار البروتوكول له تأثير كبير على سلوك النظام. في سيناريو Queue Streaming، وجد أن زمن الإكمال الكلي يختلف بنسبة تصل إلى 36.5% بين البروتوكولات، كما يختلف متوسط زمن الانتقال بمقدار 3.48 ثوانٍ. في ظل استعادة Fail-Storm، يتبين أن قدرة المقاومه أيضًا تختلف بشكل متسق بين البروتوكولات.

لكن ما يميز ProtocolBench حقًا هو تقديمه لـ ProtocolRouter، وهو موجه بروتوكول قابل للتعلم يختار البروتوكولات المناسبة لكل سيناريو بناءً على متطلبات الإشعار والزمن. أظهرت التجارب أن ProtocolRouter يقلل من زمن استعادة Fail-Storm بنسبة تصل إلى 18.1% مقارنة بأفضل بروتوكول منفرد، بالإضافة إلى تحقيق مكاسب خاصة بالسيناريو مثل النجاح الأعلى في GAIA.

وأخيرًا، تم إصدار ProtocolRouterBench لتوحيد تقييم البروتوكولات وتحسين الموثوقية على نطاق واسع.

هل أنتم مستعدون لتجربة ProtocolBench؟ شاركونا آراءكم وتجاربكم في التعليقات!