شهدت السنوات الأخيرة تطوراً سريعاً في أنظمة الوكلاء المتعددة المعتمدة على نماذج اللغة الضخمة (Large Language Models)، والتي تُظهر قدرة فائقة على اتخاذ القرارات بشكل تعاوني وحل المشكلات المعقدة. ومع ذلك، فإن وجود وكيل خاطئ داخل هذه الأنظمة قد يؤدي إلى إدخال معلومات مضللة تؤثر سلباً على أداء النظام. هذا الوضع يستدعي اهتمام الباحثين لاستكشاف آليات الهجوم والاستراتيجيات الدفاعية اللازمة لمواجهة هذه التحديات.

على الرغم من أن الدراسات السابقة كانت تفترض أن الوكلاء الخبيثين يعملون باستقلالية وتتناول الدفاع عنهم، فقد أظهرنا أن هؤلاء الوكلاء قد يتعاونون فيما بينهم، مما يمكّنهم من تنفيذ هجمات أكثر فاعلية من خلال تبادل المعلومات الداخلية. في هذا البحث، نقدم إطار عمل للهجمات التعاونية الذكية حيث يمكن للوكلاء الخبيثين تنسيق هجماتهم وضبط استراتيجيات الهجوم بشكل ديناميكي عبر تفاعلات متعددة.

علاوة على ذلك، نقدم تحليل الثقة على مستوى الجملة وإجراءات التصحيح (Sentence-Level Trustworthiness Analysis and Rectification - STAR)، وهو إطار دفاعي يكشف عن المعلومات المضللة ويقوم بتصحيحها على مستوى الجملة ضمن اتصالات الوكلاء. أظهرت تجاربنا أن الهجمات التعاونية تؤدي إلى انخفاض أكبر في معدل النجاح في المهام مقارنةً بالهجمات المستقلة، حيث كان الانخفاض النسبي 5.34%. من جهة أخرى، أثبت نظام STAR فعاليته في التخفيف من التهديدات التعاونية والمستقلة، مما عزز معدل نجاح المهام بمعدل وسط وصل إلى 36.76%. ولمن يهتم بالتفاصيل التقنية، يمكنكم زيارة صفحة الكود على GitHub.