في زمن تكنولوجيا الذكاء الاصطناعي المتسارعة، يبدو أنه من الضروري إعادة النظر في كيفية تقييم امتثال الأنظمة الذكية للقوانين والتنظيمات. تكشف دراسة حديثة نشرت على منصة arXiv عن نظام جديد يُعرف بـ"الحوكمة من خلال المؤشرات" (Governance from Metrics) والذي يقترح طريقة فعالة لمراقبة توافق أنظمة الذكاء الاصطناعي بشكل مستمر بدلًا من الاعتماد على التقييمات الثابتة بين الحين والآخر.

المشكلة القائمة حاليًا إن تقييم الامتثال غالبًا ما يتم اعتباره نتيجة ثنائية تُقاس خلال عمليات التدقيق، مما يتعارض مع ما يطالب به قانون الذكاء الاصطناعي في الاتحاد الأوروبي (EU AI Act) من إشراف بشري دائم وقدرة على كشف التغيرات في سلوك الأنظمة عند نشرها. يهدف الإطار الجديد المعروف بـ"govllm" إلى قياس الأداء بشكل مستمر من خلال قدرات الرصد المباشر، حيث يتم تحديد اختيار النماذج من خلال النقاط التراكمية لتوافقها بدلاً من الاعتماد فقط على زمن الاستجابة أو التكلفة.

يتضمن هذا الإطار مجموعة من القضاة المتخصصين في تقييم الأنظمة الذكية، مما يوفر صوتًا بشريًا في الحالات التي تظهر فيها تباينات بين القضاة. تكشف النتائج الأولية عن اتفاقية تتراوح بين 51.5% و69.1% بين النماذج، مما يشير إلى أهمية التفكير الجماعي في تعزيز دقة التقييمات. كما تم توثيق ثلاث أنماط فشل هيكلي في القضاة الصغار، مما يدعم الحاجة إلى أداة موثوقة تدعم البحث في حوكمة الذكاء الاصطناعي.

من المثير أن هذه الأداة ستُطرح كمصدر مفتوح لجمهور الباحثين، مما يتيح لهم إجراء أبحاث قابلة للتكرار في مجال حوكمة الذكاء الاصطناعي.

كيف ترون مستقبل مراقبة الامتثال في الأنظمة الذكية؟ شاركونا آراءكم في التعليقات!