في عالم تكنولوجيا المعلومات الذي يعتمد بشكل متزايد على خدمات الميكروسيرفيس (Microservices)، أصبح تحليل الأسباب الجذرية (Root Cause Analysis - RCA) ضرورة ملحة لضمان عمل الأنظمة بكفاءة. ولكن، على الرغم من تطور الوكلاء المعتمدين على نماذج اللغات الضخمة (Large Language Models - LLM)، إلا أن موثوقيتهم لا تزال تواجه تحديات كبيرة. فقد يحدث خطأ في جمع الأدلة المبكرة، أو تشكيل الفرضيات، أو حتى التحليل السببي، مما يؤدي إلى تشويه النتيجة النهائية.

في هذا السياق، تم تقديم إطار STAR، والذي يرمز إلى "إطار تصنيف وإصلاح الأخطاء"، كحل مبتكر لتحسين أداء وكلاء RCA. يعتمد STAR على تقسيم عملية RCA إلى أربع مراحل منظمة: حزمة الأدلة (Evidence Package - EP)، مجموعة الفرضيات (Hypothesis Set - HS)، هيكل التحليل (Analysis Structure - AS)، وتقرير القرار (Decision Report - DR). وبدلاً من اعتبار فشل الوكيل كخطأ شامل، يعامل إطار STAR الفشل كخلل قابل للتحديد في مرحلة معينة، مما يسهل إصلاح الأخطاء بشكل موضعي.

بفضل التكنولوجيا المتقدمة الموجودة في LangGraph، يقوم STAR بتحقيق تدقيق للمرحلة، وتوجيه ذكي يعتمد على الميزانية (Fast/Slow Routing)، وتقييم مرشح عكس الأمور لتحديد المرحلة الخاطئة بدقة. تم تقييم STAR على مجموعة بيانات حقيقية ضمن بيئات إنتاجية، حيث أظهرت التجارب تحسنًا ملحوظًا في تحديد الأسباب الجذرية وتصنيف أنواع الأخطاء.

نتائج التجارب تشير إلى أن STAR لا يخاطر فقط بتحديد المرحلة الخاطئة بدقة عالية، بل يقوم أيضاً بإصلاح معظم المسارات الخاطئة في جولات إعادة واحدة أو اثنتين. وهذا يدعم فكرة أن النمذجة المباشرة لمكان الفشل يمكن أن تكون خطوة فعالة نحو إنشاء أنظمة RCA موثوقة وقابلة للتصحيح ذاتيًا. إذًا، كيف يمكن أن يغير STAR ممارسات RCA الحالية في عالم تقنية المعلومات؟ دعونا نتحدث حول ذلك.