في عالم الذكاء الاصطناعي المتسارع، تظهر الحاجة الملحة لفهم وتقييم أمان المهارات التي يستخدمها وكلاء الذكاء الاصطناعي (AI Agents). تشير دراسة حديثة بعنوان "إشارات أمان ClawHub" إلى أهمية التحليلات المتنوعة في تصنيف المهارات الذكية وتقييم موثوقيتها.
تتضمن البيانات الم sanitized التي تم جمعها 67,453 نسخة من المهارات العامة لأداة OpenClaw، حيث تم إعداد كل صف بطريقة نظامية لدمج المحتوى المأخوذ من ملفات SKILL.md والملفات المجمعة، إلى جانب الحكم النهائي من سجل ClawScan وعناصر من ثلاث عائلات للمسح: VirusTotal، التحليل الثابت (Static Analysis)، وNVIDIA SkillSpector.
المثير للاهتمام هو أن التوافق بين هذه الأدوات نادر جدًا، حيث لا يتجاوز تداخل أي زوج 10.4% من إيجابياتهم المجمعة. فقط 0.69% من المهارات تم تمييزها من قبل الثلاثة، بينما تم تحديد 81.9% من المهارات المميزة بواسطة أداة واحدة فقط. تكشف النتائج عن أن أداة SkillSpector، التي تركز على المخاطر المعنوية بدلاً من إشارات سمعة البرمجيات الخبيثة، إيجابية لـ 19,209 من 25,504 صفوف مشبوهة، لكن فقط لـ 14 من 206 صفوف خبيثة.
هذه البيانات تسلط الضوء على ضرورة وجود إدارة متعددة للمهارات الأمنية، حيث لا يمكن الاعتماد على قرار مسموح/محظور من خلال أداة واحدة فقط. وقد تم إطلاق هذه المجموعة كمجموعة بيانات معايير فضية م sanitized، مع توفر أحكام السجل الآلي بدلاً من الحقائق المُعلنة بواسطة البشر. هذه الإصدارات تمثل لقطة مبكرة تهدف إلى دعم المجتمع بينما يتم تطوير مجموعة جزئية مُعَلَّمة بواسطة البشر.
تتطلب أمان مهارات الوكلاء تعزيز الأبحاث المستقبلية، بما في ذلك نماذج مصممة خصيصًا لتحديد المخاطر الأمنية للمهارات. فما رأيكم في هذه النتائج؟ هل ترون ضرورة لتعزيز إدارة الأمان في نماذج الذكاء الاصطناعي؟ شاركونا آرائكم في التعليقات!
مواجهة متاهة الأمان: عندما يختلف VirusTotal وStatic Analysis وSkillSpector!
استكشاف الدرجات المتباينة في أمان المهارات المستخدمة في الذكاء الاصطناعي بين أدوات الفحص الشهيرة. دراسة جديدة تكشف النقاب عن أهمية التنوع في أدوات الأمان.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
