في ظل التقدم المطرد في مجال الذكاء الاصطناعي، يظهر تحدٍ جديد يتعلق بكيفية تداخل المهارات المختلفة المستخدمة من قبل الوكلاء (Agents). يتزايد اعتماد هذه الوكلاء على مهارات قدمها المجتمع، مما يعزز من قدراتهم التشغيلية. ولكن ماذا يحدث عندما تلتقي هذه المهارات الآمنة لتشكل مجموعة مهارات غير آمنة؟
هذا السؤال يطرحه الباحثون في دراستهم الجديدة التي تقدم إطار عمل مبتكراً يُعرف باسم SkillReact. يهدف هذا الإطار إلى قياس السلامة التركيبية للمهارات، ويتكون من ثلاثة مكونات رئيسة: معيار تركيب ثابت، نظام حكم بشري بمساعدة نماذج اللغة الكبيرة (LLMs)، ومنصة استغلال تعتمد على الأفعال.
في اختبار تفصيلي لأكثر من 1500 مهارة على منصة ClawHub، تبين أن 651 مهارة منها فقط نجت من الفحص الفردي، مما أدى إلى تكوين 211,575 زوج من المهارات. وقد تم تحديد 22.25% من هذه الأزواج كمرشحة هيكلياً للمخاطر. وفي تقييم أكثر دقة، أظهرت النتائج أن حوالي واحد من كل خمسة أزواج تم تحديدها كمخاطر تركيبية حقيقية، مما يعني وجود حوالي 14,000 حالة خطر حقيقية في سجل واحد، حيث لا تستطيع عمليات الفحص الفردي التشخيص بدقة بسبب الطبيعة الآمنة لكل مهارة.
تُظهر النتائج أن جودة السلامة تعتمد بشكل حاسم على مواقف النماذج المُستضافة، حيث تأتي استجابات المهارات متفاوتة عندما تخضع لاختبارات تطبيق معينة. فعلى سبيل المثال، في اختبارات محددة، أصدرت بعض النماذج طلبات تنفيذ كاملة بينما توقفت أخرى عند مرحلة التحميل فقط.
تُظهر هذه النتائج أهمية إجراء فحوصات تركيبية عند تثبيت المهارات وعزل القدرات كإجراءات موازية لفحوصات السلامة الفردية. إذ يتمثل الهدف في ضمان أن الوكلاء لا يمكنهم تجميع مهارات تؤدي إلى إجراءات ضارة أثناء أدائهم لمهامهم.
فما رأيكم في أهمية هذه الدراسة وأثرها على مستقبل الذكاء الاصطناعي؟ شاركونا آرائكم في التعليقات.
تحديات جديدة في الذكاء الاصطناعي: قياس مخاطر المهارات المركبة في أنظمة الوكلاء
تتزايد المخاوف حول تكوين مهارات غير آمنة من مهارات فردية آمنة في أنظمة الذكاء الاصطناعي. يمثل إطار SkillReact حلاً مبتكراً لمشكلة السلامة في هذه الأنظمة المعقدة.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
