في عالم الذكاء الاصطناعي، تُعد المهارات (Skills) من المكونات الأساسية التي تمكّن الوكالات (Agents) الكبيرة من إعادة استخدام التعليمات والموارد والأدوات. ومع ذلك، تكشف هذه المهارات عن فرص جديدة للسلوكيات الخبيثة التي قد تتخفي تحت غطاء آمن.
تظهر المشكلة عندما تبدو المهارة في الوثائق أو التعليمات غير ضارة، لكنها تتحول إلى خطر عندما تُستخدم مع طلبات محددة من المستخدم أو أصول محلية أو حالات مستمرة أو خلال تفاعلات مع أدوات متعددة. الأمر الذي يجعل الفحص الساكن (Static Vetting) يواجه صعوبة في تقديم حماية فعالة.
تقدم لنا تقنية تدقيق المهارات في الزمن الحقيقي (Runtime Skill Audit - RSA) وسيلة تحليل ديناميكية تتجاوز الفحص التقليدي، حيث تعتمد على تقييم ما يقوم به الوكيل الذكي تحت ظروف زمنية مستهدفة. بدلاً من اختبار كل مهارة باستخدام مهام عامة، يحدد الـ RSA الواجهات ذات المخاطر المحتملة، ويحضر السياق اللازم لتطبيقها، ويعين علامات الأمان اعتمادًا على الأدلة التي تم جمعها.
تم تطبيق تقنية الـ RSA على نظام OpenClaw وتم تقييمها على 100 مهارة، حيث حققت دقة تصل إلى 90% مع معدل إيجابي صحيح يبلغ 88% ونسبة إيجابية خاطئة 8%. وهذا يمثل تحسنًا بواقع 13% مقارنة بأفضل النتائج الساكنة. في مواجهة الهجمات الذاتية التطور، انهارت الكواشف الساكنة بعد جولة أو جولات قليلة، بينما استمر الـ RSA في كشف 19 إلى 20 مهارة خبيثة على مدار الجولات المختلفة.
مع تطور عالم الذكاء الاصطناعي، يتطلب الأمر تقنيات متقدمة لضمان أمان المهارات، والـ RSA تقدم لنا طريقة فعّالة لتحقيق ذلك. كيف ترون تطور أساليب الأمان في المجال؟ شاركونا آرائكم في التعليقات!
تدقيق المهارات في الزمن الحقيقي: كيف نحمي وكالات الذكاء الاصطناعي من السلوكيات الخبيثة؟
تقدم تقنية تدقيق المهارات في الزمن الحقيقي (Runtime Skill Audit) طريقة مبتكرة لتحليل سلوكيات وكالات الذكاء الاصطناعي. هذه التقنية تعزز دقة الأمان وتساعد على كشف المهارات الضارة في بيئات العمل الديناميكية.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
