تعد تقييمات تحليل الجذور (Root-Cause Analysis - RCA) أداة أساسية لضمان أداء الأنظمة المختلفة، ولكنها تواجه تحديًا كبيرًا يتجسد في التصنيفات الموحدة التي تُلمّح إلى فائز واحد على مستوى كُل الأنظمة. في بحث جديد نشر على منصة arXiv، تم إجراء تدقيق شامل لثلاث مجموعات تقييم عامة: OpenRCA، RCAEval، وPetShop، والتي تغطي 11 نظامًا فرعيًا و778 وحدة قياس متطابقة.

ركز الباحثون على الحفاظ على مقارنة زوجية دقيقة من خلال اختيار أربعة طرق توفر تغطية كاملة للتحليل: BARO، وهو محول CD-1min، الطريقة القصوى max-$|Z|$، وعدد التنبيهات حسب الخدمة per-service alert-count. وفي أثناء تحليل النتائج، تم اكتشاف أن كل المقارنات الزوجية تظهر تأثيرات على مستوى الأنظمة الفرعية، حيث تعبر توقعات التأثير العشوائية بنسبة 95% عن عدم التوازي، ما يدل على أهمية النظر في نوعية النظام الفرعي عند تحليل النتائج.

وعندما تم تقليل عدد الأنظمة إلى واحدة، كانت الطرق ذات التقييم المنخفض أكثر إذاءً في خمسة من 11 نظامًا فرعيًا محجوزًا، حيث وصلت مستويات الإحباط إلى 24.8 نقطة مئوية في RCAEval / Sock-Shop. لإتاحة المعلومات للباحثين والمهندسين، تم إصدار وحدة تدقيق شاملة تتكون من 320 سطرًا، والتي يمكنها إعادة حساب تدقيق الاستقرار على مستوى النظام الفرعي بجانب تسجيلات النتائج الموحدة.

هذا البحث يسلط الضوء على ضرورة فهم الفروقات بين الأنظمة واستخدام أساليب التحليل الأكثر دقة لتحسين النتائج في التقارير، مما يجعلنا نتساءل: كيف يمكن تعزيز فعالية معايير تحليل الجذور لتحقيق نتائج أكثر دقة؟ من فضلكم شاركونا آرائكم في التعليقات.