في خطوة رائدة نحو تحسين فهمنا لاضطرابات سلوك الذكاء الاصطناعي، تم تقديم M-CARE (تقييم وإبلاغ حالات الذكاء الاصطناعي) كإطار عمل متقدم مستنبط من الطب البشري. يتميز هذا النظام بتنسيق تقريري يتكون من 13 قسمًا ونظام تقييم تشخيصي يعتمد على أربعة محاور تصنيفية ترسم معالم السلوك غير الطبيعي لنماذج الذكاء الاصطناعي.
يغطي M-CARE 20 حالة تم جمعها من ثلاث فئات رئيسية: ملاحظات ميدانية لوكلاء تم نشرهم (8 حالات)، تجارب محكومة عبر ثلاثة منصات (8 حالات)، ومصادر منشورة (4 حالات). الحالات مصنفة إلى خمس فئات مميزة تشمل: الأدلة السلوكية الناتجة عن التعلم المعزز (RLHF)، اختلال البنية التشغيلية، Conditions الذاكرة والسياق، الهوية الأساسية والمرونة، وضغوط الطريقة والقيود المطرحية.
من بين الحالات البارزة، يظهر اختلال السلوك الناتج عن التعليمات اللولبية (SIBO)، وهو تجربة محكومة تظهر كيف أن التعليمات من Shell يمكن أن تتجاوز سلوك التعاون الافتراضي للنموذج بشكل قاطع. تم التحقق من SIBO عبر خمس مجالات ألعاب (لعبة الثقة، البوكر، أفالون، كود نايمز، والشطرنج)، وكشفت النتائج عن طيف مرتبطة بالمساحات الممكنة، حيث تراوح مؤشر SIBO من 0.75 إلى 0.10 وذلك حسب تعقيد إجراءات العمل والخبرة الأساسية.
الأمر الأكثر إثارة هو أن M-CARE قابل للتوسع، مما يعني أنه يمكن دمج حالات وفئات جديدة دون الحاجة إلى تعديل الإطار. وقد تم إصدار الإطار وجميع تقارير الحالات العشرين والبيانات التجريبية كموارد مفتوحة للجميع.
انطلاقاً من هذه الابتكارات، يُبرز M-CARE الأهمية المتزايدة لفهم سلوك أنظمة الذكاء الاصطناعي وتقديم استراتيجيات تشخيصية واضحة في هذا المجال الحديث.|
M-CARE: الإبلاغ السريرى الموحد لتقييم اضطرابات سلوك الذكاء الاصطناعي!
تقدم M-CARE إطار عمل مبتكر لتقارير الحالات السريرية في مجال الذكاء الاصطناعي، يهدف إلى تقييم سلوك النماذج بطريقة منهجية. يتضمن تحليل 20 حالة تجريبية من تجارب ميدانية وأخرى محكومة، مع نتائج مثيرة تدعو للتأمل.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
