تُستخدم نظم الخدمات المصغرة (Microservice Systems) بشكل واسع في بناء التطبيقات السحابية، إلا أن تعقيدها يجعل من الفشل أمرًا لا مفر منه، ما يؤثر سلبًا على تجربة المستخدم ويؤدي إلى خسائر اقتصادية كبيرة. في هذا السياق، يكتسب البحث في الكشف الآلي عن الشذوذ (Anomaly Detection) وتحليل الأسباب الجذرية (Root Cause Analysis - RCA) طابعًا متجددًا، حيث يستعرض باحثون حاليون خمسة قيود رئيسية تواجه التقنيات الراهنة.

أولاً، تميل معظم الطرق الحالية إلى التعامل مع الكشف عن الشذوذ وتحليل الأسباب الجذرية بشكل منفصل، معتقدة أن الكشف يتم بشكل دقيق، وهو ما يضعف فعاليتها عندما يكون هناك ضوضاء أو تأخير يؤثر على الدقة. ثانيًا، تركز الأساليب المتبعة على مقاييس الأداء (Metrics) والسجلات (Logs) وآثار الأحداث (Traces)، مما يتجاهل بيانات الأحداث مثل استدعاءات واجهة برمجة التطبيقات (API Calls) وتغيرات التكوين، وهي جوانب تأخذ حيّزًا ضئيلًا في الاستكشاف.

ثالثًا، تعتمد العديد من الأساليب على وجود رسم بياني لاستدعاءات الخدمات ولا يمكنها التشخيص بدون واحد، مما يحد من مرونتها. رابعًا، تعاني هذه الممارسات من نقص في المجموعات البيانات القياسية وإطارات التقييم، مما يصعّب عملية المقارنة العادلة بين الأساليب. وخامسًا، على الرغم من أن تحليل الأسباب الجذرية المعتمد على الاستدلال السببي أصبح سائدًا، فإن فعاليته وكفاءته وموثوقيته لا تزال غير واضحة.

يتناول هذا البحث هذه القيود من خلال مجموعتين من المساهمات. الأولى تقدم طرقًا تستغل بيانات الرؤية (Observability Data) بشكل مستقل وجماعي، مثل "BARO"، وهي طريقة شاملة للكشف عن الشذوذ وRCA لمقاييس البيانات. بينما توفر "EventADL" إطار عمل شامل لبيانات الأحداث وترتقي لتكون إطارًا متعدد الأنماط "TORAI" لا يتطلب وجود رسم بياني لاستدعاءات الخدمات. وقد أظهرت التجارب الواسعة على نظم الخدمات المصغرة الحقيقية فعالية هذه الطرق وموثوقيتها.

أما المجموعة الثانية فتقدم مجموعات بيانات معيارية، وإطار تقييم، وجهود تقييم منهجي. و"RCAEval" هو معيار شامل يوفر مجموعات بيانات جاهزة للاستخدام ومعايير يمكن إعادة إنتاجها للبحوث المستقبلية. كما يقدم تقييم منهجي للأساليب الحالية في RCA، خاصة المعتمدة على الاستدلال السببي، ويقدم رؤى توجيهية لتوجيه الاتجاهات المستقبلية.

بذلك، يدفع هذا البحث عجلة التطور في الكشف الآلي عن الشذوذ وتحليل الأسباب الجذرية لفشل نظم الخدمات المصغرة، مما يمهد الطريق لأبحاث مستقبلية مركزة على التخفيف من الحوادث وإصلاحها.