في عصر الذكاء الاصطناعي، أصبحت المهارات تمثل الطبقة الأساسية التي يتمكن من خلالها الوكلاء، مثل نماذج اللغات الضخمة (Large Language Models)، من تحويل الخطط إلى أفعال ملموسة. ومع ذلك، يحمل استخدام هذه المهارات مخاطر أمنية قد تكون غير مرئية، مثل تسريب البيانات والعمليات غير المصرح بها، وسوء استخدام الأدوات.
يستخدم التقييم الحالي عادةً تقنيات تعتمد على تقييم كل مهارة بمفردها، ولكن العمل الحقيقي للوكلاء يتطلب تفاعل مهارات متعددة ضمن سياق تنفيذ مشترك. وهنا تكمن مشكلة "مخاطر تجميع المهارات" (Skill Composition Risk - SCR)، حيث أن المهارة التي تبدو آمنة بمفردها يمكن أن تتحول إلى مصدر خطر عندما تؤثر مخرجاتها، أو إشارات الثقة، أو مؤشرات التفويض على عمليات لاحقة على نفس المسار.
لذلك، تم تقديم نموذج SCR-Bench لتقييم هذه المخاطر في بيئات مهارية محكومة. لا يركز SCR-Bench فقط على النوايا النصية أو السلوك الظاهري، بل يسجل التغييرات في الحالة في المراحل التالية ونتائج المسارات عبر تنفيذ المهارات المجمعة. يحتوي النموذج على ثلاثة مقاييس فرعية: SCR-CapFlow لتجميع تدفق القدرات، SCR-TrustLift لتجميع نقل الثقة، وSCR-AuthBlur لتجميع الارتباك في التفويض.
تشير النتائج إلى أن المسارات المجمعة تُظهر مخاطر تظل غائبة في ظل التقييم المعزول. في SCR-CapFlow، تصل نسبة نجاح الهجمات إلى 33.6% ضمن التجميع، مقارنة بحالات منفردة قريبة من الصفر. وفي SCR-TrustLift، تتجاوز معدلات النجاح 96.5% في أربعة من خمسة أنظمة خلفية. أما في SCR-AuthBlur، تزداد نسبة الموافقة الخطرة بنسبة 71.8% مقارنة بأساسيات الحالة المعزولة.
تُظهر هذه النتائج أن الأمن المرتبط بمهارات الوكلاء يجب أن يتم تقييمه على مستوى المسارات النشطة بدلاً من العناصر المعزولة. بالتالي، يضع كل من SCR وSCR-Bench أساساً لتقييم المخاطر وتطوير الدفاعات في أنظمة مهارات وكلاء الذكاء الاصطناعي.
مخاطر مهارات الوكلاء: كيف تتحول المهارات البريئة إلى تهديدات أمنية!
قد تبدو استخدامات المهارات في وكلاء الذكاء الاصطناعي آمنة عند النظر إليها بصورة منفصلة، لكن عند دمجها، يمكن أن تصبح خطيرة. تعرفوا على نموذج SCR-Bench الذي يكشف المخاطر الخفية.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
