مع صعود أنظمة الوكلاء المتعددة (Multi-Agent Systems) المعتمدة على نماذج اللغة الكبيرة (Large Language Models)، يبرز التحدي الكبير المتمثل في الأمان الذي يهدده ضعف الانتشار. حيث يمكن للوكلاء الخبيثين أن يشوهوا عملية اتخاذ القرار الجماعية من خلال تفاعلات الرسائل بين الوكلاء.

في الوقت الذي أظهرت فيه أساليب الدفاع الخاضعة للإشراف فعالية واعدة، إلا أنها قد تواجه صعوبات كبيرة في التطبيقات الواقعية بسبب اعتمادها الثقيل على وجود بيانات وسوم خبيثة لتدريب نموذج كشف عن السلوكيات الضارة.

في هذا السياق، كشفت دراسة جديدة عن ابتكار يدعى BlindGuard، وهي طريقة دفاع غير خاضعة للإشراف لا تحتاج إلى أي وسوم هجمومية أو معرفة مسبقة بالسلوكيات الخبيثة. يعتمد BlindGuard على بنية تشفير هرمية للتفاعل بين الوكلاء، تلتقط أنماط التفاعل الفردية والجوارية والعالمية، مما يمنح فهماً شاملاً لكيفية الكشف عن الوكلاء الخبيثين.

كما تم تصميم جهاز كشف موجه بالتخريب، يتكون من حقن ضجيج اتجاهي والتعلم المقارن، مما يسمح بتدريب نموذج كشف فعال فقط على سلوكيات الوكلاء الطبيعية.

أظهرت التجارب الواسعة أن BlindGuard يكتشف بفعالية أنواع متنوعة من الهجمات مثل حقن الطلب، تسمم الذاكرة، وهجمات الأدوات عبر أنظمة الوكلاء المتعددة ذات أنماط الاتصال المتنوعة، مع المحافظة على تفوقه في العمومية مقارنة بأساليب الدفاع الخاضعة للإشراف.

لمعرفة المزيد حول كيفية حماية أنظمتك، يمكنك الاطلاع على الكود الخاص بـ BlindGuard [هنا](https://github.com/MR9812/BlindGuard).