في وقت يتزايد فيه استخدام وكالات الذكاء الاصطناعي (AI Agents) في اتخاذ إجراءات حاسمة مثل تعديل الملفات وتنفيذ الأوامر، تتزايد الحاجة إلى أنظمة رقابة موثوقة. يقوم النظام القياسي على إشراك الإنسان كحاجز موافقة، حيث تتوقف الإجراءات الخطرة في انتظار مراجعة بشرية. لكن، هل هذه الآلية بالغة الفعالية؟

تشير دراسة حديثة نشرها باحثون على منصة arXiv إلى أن الحكم البشري في تقييم المخاطر غالبًا ما يكون غير متماسك. فقد أظهر تحليل لعدد 125 إجراءً يتسم بالتحدي أن المت reviewers ليسوا متفقين تمامًا على ما يعتبر إجراءً خطيرًا، حيث بلغ مستوى الاتفاق بينهم (Fleiss' kappa = 0.52). وهذا يعني أنه لا يوجد معيار وحيد يمكن الاعتماد عليه.

علاوة على ذلك، قد يؤدي الضغط النفسي الذي يتعرض له المراجعون، بسبب تزايد وتنويع الأعباء، إلى نتائج عكسية. على عكس التوقعات، قد يكون وجود مراقبة بشرية أكثر مما يلزم، خطرًا على النظام. إذ يتبين أن الأمان المثالي قابل للتحقيق عندما يتم تقليل مستويات الرقابة، مما يثير التساؤلات حول فعالية الرقابة البشرية.

تطرح الدراسة أيضًا فكرة "التعلم المرتبط بالإجهاد لتأجيل القرارات" (Fatigue-Aware Learning-to-Defer - FALCON) وكيف أن فهم سلوك المراجعين في بيئات العمل مثل هذه يمكن أن يسهم في تصميم أنظمة أكثر أمانًا.

إن تطوير أنظمة إشراف مفتوحة المصدر يمكن أن يعمل على قياس وتحسين أداء وكالات الذكاء الاصطناعي في بيئة العمل الحالية، مما يتيح للمطورين والمستخدمين تقييم فعالية الإجراءات المتبعة بشكل دقيق.

المفاهيم المطورة في هذه الدراسة تدعو إلى ضرورة الاهتمام بالرقابة البشرية، وتدعو إلى النقاش حول كيفية تصميم الأنظمة التي تشارك الإنسان دون أن تعرض الأمن للخطر.

ما رأيكم في هذا التطور؟ هل تعتقدون أن الرقابة البشرية قادرة على ضمان الأمان في الأنظمة الذكية أم أن الإشراف البشري يمثل مصدراً للمخاطر؟