في عالم الذكاء الاصطناعي، تُعتبر الوكلاء على شكل مخالب (Claw-like agents) مثل OpenClaw أكثر من مجرد وظيفية عادية. إنهم ليسوا مجرد أدوات بل هم عمليات مستمرة تتمتع بالوصول الدائم إلى بيانات المستخدم وكلمات المرور والخدمات الخارجية. لكن ما الذي يعنيه ذلك بالنسبة للأمن السيبراني؟

هذه الوكلاء تتحمل مسؤوليات على مستوى النظام، حيث تقوم بتركيب الحزم، والحفاظ على الحالة، وجداول المهام، والوساطة في الإدخال/الإخراج، مما يجعل أي فشل في الأمان أكثر خطورة مقارنة بالنماذج الأخرى. ومع أن المعايير الحالية تركز فقط على ردود الفعل للنماذج واستدعاءات الأدوات، فإن أنماط الفشل بين المكونات لم يتم قياسها بدقة.

نقوم هنا باستخدام تشبيه نظام الكمبيوتر، حيث يُعتبر الوكيل على شكل مخلب نظامًا كمبيوتريًا عميلًا، حيث يلعب وقت تشغيل بوابة الوكيل دور نظام تشغيل مماثل، وتستذكر المهارات التطبيقات المثبتة من قبل المستخدم، بينما تشبه الإضافات ملحقات قابلة للتحميل بامتيازات زمن التشغيل.

لتقييم أمان هذه الأنظمة، تم تطوير معيار SafeClawArena الذي يحتوي على 406 مهمة عدائية عبر أربعة مجالات هجومية، يتم تنفيذها في نسخ حاوية من منصات الوكلاء الحقيقية المُعلمة بكلمات مرور خاصة. نجري تقييمًا لثلاث منصات (OpenClaw, NemoClaw, SeClaw) وخمسة نماذج لغات كبيرة (LLMs). نتائج تجربتنا تشير إلى أن أعلى معدل نجاح للهجوم يصل إلى 70%، مع نجاح الإضافات الضارة في 100% من الحالات.

بينما يُقلل SeClaw من معدل النجاح للهجوم لـ GPT-5.4 من 70% إلى 22%، فإن Claude-Opus-4.6 يستقر بالفعل بالقرب من سقف 22% على كل منصة. تشير هذه النتائج إلى عدم كفاية الدفاعات الحالية وتقترح اتجاهات للتحسين المستقبلي.

يمكنك الاطلاع على الشيفرة والبيانات ذات الصلة على GitHub. ما هي أفكاركم حول مخاطر الأمان التي تطرحها هذه الأنظمة؟ شاركونا في التعليقات.