شهدت السنوات الأخيرة تطوراً سريعاً في أنظمة الوكلاء المتعددة المعتمدة على نماذج اللغة الضخمة (Large Language Models)، والتي تُظهر قدرة فائقة على اتخاذ القرارات بشكل تعاوني وحل المشكلات المعقدة. ومع ذلك، فإن وجود وكيل خاطئ داخل هذه الأنظمة قد يؤدي إلى إدخال معلومات مضللة تؤثر سلباً على أداء النظام. هذا الوضع يستدعي اهتمام الباحثين لاستكشاف آليات الهجوم والاستراتيجيات الدفاعية اللازمة لمواجهة هذه التحديات.
على الرغم من أن الدراسات السابقة كانت تفترض أن الوكلاء الخبيثين يعملون باستقلالية وتتناول الدفاع عنهم، فقد أظهرنا أن هؤلاء الوكلاء قد يتعاونون فيما بينهم، مما يمكّنهم من تنفيذ هجمات أكثر فاعلية من خلال تبادل المعلومات الداخلية. في هذا البحث، نقدم إطار عمل للهجمات التعاونية الذكية حيث يمكن للوكلاء الخبيثين تنسيق هجماتهم وضبط استراتيجيات الهجوم بشكل ديناميكي عبر تفاعلات متعددة.
علاوة على ذلك، نقدم تحليل الثقة على مستوى الجملة وإجراءات التصحيح (Sentence-Level Trustworthiness Analysis and Rectification - STAR)، وهو إطار دفاعي يكشف عن المعلومات المضللة ويقوم بتصحيحها على مستوى الجملة ضمن اتصالات الوكلاء. أظهرت تجاربنا أن الهجمات التعاونية تؤدي إلى انخفاض أكبر في معدل النجاح في المهام مقارنةً بالهجمات المستقلة، حيث كان الانخفاض النسبي 5.34%. من جهة أخرى، أثبت نظام STAR فعاليته في التخفيف من التهديدات التعاونية والمستقلة، مما عزز معدل نجاح المهام بمعدل وسط وصل إلى 36.76%. ولمن يهتم بالتفاصيل التقنية، يمكنكم زيارة صفحة الكود على GitHub.
تحصين أنظمة الوكلاء المتعددة المعتمدة على نماذج اللغة ضد الهجمات التعاونية
تسعى الأبحاث الحديثة إلى تعزيز أنظمة الوكلاء المتعددة (MAS) المعتمدة على نماذج اللغة ضد الهجمات التعاونية التي تستهدف إدخال معلومات مضللة. من خلال إطار عمل مبتكر، يتمكن الباحثون من التصدي لمثل هذه التهديدات بفاعلية.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
