في عالم الذكاء الاصطناعي، تتجه الأنظار نحو الأنظمة متعددة الوكلاء (Multi-Agent Systems) التي تعتمد على نماذج اللغات الضخمة (Large Language Models) لتوزيع المهام بين وكلاء متخصصين. ولكن، هل تساءلت يومًا كيف يمكن لهذه الأنظمة المتطورة أن تُساهم في زيادة مخاطر الأمان؟

تُظهر الأبحاث الأخيرة أن هناك "مفارقة قدرات" مدهشة حيث تزداد نسبة نجاح الهجمات (Attack Success Rate - ASR) فعليًا مع ارتفاع قدرات الوكلاء. فبينما يُفترض أن الوكلاء الأكثر ذكاءً يجب أن يعملوا على تعزيز الأمان، نجد أن هناك مخاطر جديدة تنشأ، كالهجمات المعروفة باسم "اختطاف الدلالات" (Semantic Hijacking)، حيث تُخفي الطلبات الضارة ضمن روايات متخصصة وتنتقل إلى المديرين مما يؤدي إلى تنفيذ قرارات غير آمنة.

أوضحت الدراسات التي شملت 42,000 تجربة عدائية أن نسبة نجاح الهجمات ارتفعت من 18.4% إلى 63.9%، وبلغت ذروتها عند 94.4% في بعض السيناريوهات. كيف يحدث هذا؟ يتسبب ذلك في الغالب بزيادة ما يسمى "اليقين اللغوي" (Linguistic Certainty)، أي أن الوكلاء الأكثر موثوقية يميلون إلى اعتبار الروايات العدائية شرعية مما يعزز من ثقة المديرين في هذه التوصيات.

ولمواجهة هذه الظاهرة، يقترح الباحثون استخدام "التحقق من التجميع المتنوع" (Heterogeneous Ensemble Verification)، الذي يجمع بين وكلاء ذوي كفاءات مختلفة لتفكيك سلسلة اليقين إلى التنفيذ، مما يقلل نسبة نجاح الهجمات من 52.8% إلى 2.0% دون التأثير على المهام الآمنة.

لقد أثبتت هذه النتائج أن تحسين مكونات الأنظمة من خلال تعزيز قواها قد يؤدي في الواقع إلى تدهور الأمان، مما يستدعي ضرورة استغلال التفاوت في القدرات بين الوكلاء بدلاً من محاربته لضمان الأمن الفعال.