في عالم البيانات المتسارعة، تكون التحديات المرتبطة باكتشاف الأسباب في البيانات غير المنتظمة قضية محورية، خاصة في مجالات ك finance (المالية) وhealthcare (الرعاية الصحية) وclimate science (علوم المناخ). التعامل مع البيانات المفقودة وتكرار عينة البيانات بشكل غير متسق يمكن أن يؤدي إلى تشويه الآليات السببية، مما يستدعي ضرورة إيجاد حلول فعالة.

تسلط هذه الدراسة الضوء على ابتكار جديد يسمى ReTimeCausal، والذي يقدم إطار عمل يعتمد على تقنية EM (Expectation-Maximization) يتيح تكرار العمليات بين إتمام البيانات واكتشاف الهيكل السببي. يتناول هذا النهج التحديات الناجمة عن الاعتماد المتبادل بين إكمال البيانات واستعادة الهيكل السببي، موفراً ضمانات اتساق نظرية تساعد في تعزيز موثوقية النتائج.

توفير إطار عمل ReTimeCausal كيفية التعامل بفعالية مع البيانات المفقودة من خلال دمج تقنيات الانحدار النادرة القائم على kernel مع قيود هيكلية بطريقة متبادلة، مما يؤدي إلى تحديث كل من البيانات المكتملة والشبكة السببية بشكل دوري.

تظهر التجارب التي أُجريت على مجموعات بيانات صناعية وحقيقية أن ReTimeCausal يتفوق في الأداء على الأساليب الحالية تحت ظروف عينة غير منتظمة وبيانات مفقودة، مما يثبت أهميته في المجالات المعقدة والحساسة.

مع تقدم هذا البحث، يصبح السؤال متاحًا: كيف يمكن تحسين استخدام هذه التقنية في مجالات أعمالنا؟