في عصر يتزايد فيه الاعتماد على وكلاء الذكاء الاصطناعي (AI Agents) لأداء مهام مستقلة، تصبح مسألة السلامة إحدى أكثر القضايا إثارة للجدل. وللحد من المخاطر السلوكية التي قد تحدث بسبب هذه التكنولوجيا، تم تطوير إطار "فيرا" (Vera) لاختبار السلامة، والذي يمثل تطورًا ملحوظًا في هذا المجال.

إطار "فيرا" هو نظام آلي شامل يهدف إلى تعزيز معايير السلامة لوكلاء الذكاء الاصطناعي غير الحتميين. يتميز بكونه يعتمد على منهجية دقيقة تتكون من ثلاث مراحل متكاملة، تبدأ باستكشاف شامل للأدب المتعلق بالمخاطر الجديدة، مما يُنتج تصنيفات للمخاطر وأساليب الهجوم وبيئات التنفيذ. يستخدم "فيرا" عملية تكاملية تنشئ حالات سلامة قابلة للتنفيذ توضّح أهدافًا محددة، مما يسمح بالتحقق الدقيق من المخاطر.

تشمل المرحلة الثانية من العملية الاختبار الفردي لكل وکیل آلي في بيئات محكمة، حيث يقوم وكيل تحكمي بتوجيه التفاعلات متعددة الجولات بناءً على الملاحظات في الوقت الفعلي. وأظهرت الاختبارات على أربعة إطارات إنتاجية (OpenClaw، Hermes، Codex، Claude Code) أن ”فيرا“ يكشف عن نقاط ضعف سلامة ملحوظة، حيث سجلت معدلات نجاح الهجمات نحو 93.9% في ظل هجمات متعددة القنوات.

نتائج هذه الدراسة تؤكد على ضرورة وجود بنية تحتية لاختبار سلامة قابلة للتنفيذ وديناميكية لضمان تقييم صارم ومنظم للأنظمة الوكيلية سريعة التطور. يمكنكم الاطلاع على الكود المصدري لإطار "فيرا" عبر الرابط: [رابط الكود] على GitHub.