في عالم الذكاء الاصطناعي (Artificial Intelligence)، تبرز أهمية الأمان كأحد المحاور الأساسية. قدمت SkillSieve حلاً رائداً لمشكلة تعرض المنصات لمهارات وكلاء الذكاء الاصطناعي الضارة، حيث يوفر إطار الكشف ثلاثي الطبقات حلاً فعالاً ومبتكراً.

يستضيف سوق OpenClaw المعروف بـ ClawHub الآلاف من مهارات الوكلاء التي يساهم بها المجتمع، إذ تمثل الإحصاءات المثيرة للقلق وجود 13-26% من هذه المهارات تحتوي على ثغرات أمنية. ورغم محاولات استخدام أدوات المسح الخاصة مثل Regex، تبين أنها تفشل في اكتشاف الحمولة المخفية، بينما لا تستطيع المحللات الثابتة قراءة التعليمات المكتوبة بلغة طبيعية، مما يتيح مكاناً لأساليب الحقن الاجتماعي.

تُظهر SkillSieve طريقة مبتكرة في الكشف تتكون من ثلاث طبقات:
- **الطبقة الأولى** تتعامل مع فحص البيانات باستخدام أساليب مثل regex وAST، حيث تعمل على تصفية 86% من المهارات الضارة المحتملة.
- **الطبقة الثانية** تنقل المهارات المشبوهة إلى نماذج لغوية ضخمة (Large Language Models) وتنقسم التحليل إلى أربع مهام متوازية، مما ينتج عنه بيانات هيكلية.
- **الطبقة الثالثة** تعرض المهارات ذات المخاطر العالية أمام لجنة من ثلاث نماذج لغوية، حيث تقوم بالتصويت ومناقشة أي نقاط خلاف.

تم اختبار SkillSieve على 49,592 مهارة حقيقية من ClawHub، حيث حقق المنهج دقة عالية بلغت 0.920 بسعر منخفض يصل إلى 0.006 دولار لكل مهارة. علاوة على ذلك، أتاح استخدام مسار سريع باستخدام XGBoost تقليص عدد النداءات للنماذج اللغوية بنسبة 32% مع الحفاظ على معدل كشف جيد.

توسعت الإمكانيات الرائعة لـ SkillSieve من خلال تكييف الإطار ليشمل منصات مثل Feishu/Lark، مما أتاح التصحيح للأخطاء المكتشفة في الطبقة الأولى.

يلعب SkillSieve الآن دوراً حيوياً كروبوت دردشة في Feishu، مما يسهم في عمليات التدقيق في المهارات بشكل فوري.

إن فتح الشيفرة والمعلومات المرتبطة بالاختبارات يؤكد التزام المطورين بالمشاركة المجتمعية وتعزيز نموذج الأمان في عالم الذكاء الاصطناعي. ما رأيكم في هذا التطور الرائد؟ شاركونا في التعليقات!