في عالم الطب الحديث، يُعتبر تصنيف مشاهد تخطيط صدى القلب (Echocardiography) خطوة أساسية لتحسين الكفاءة في سير العمل السريري. رغم ذلك، يواجه هذا التصنيف تحديات كبيرة تتطلب حلولاً مبتكرة. تمثل مجموعة بيانات 'تخطيط صدى القلب لخمسة مشاهد' (Echocardiographic Videos of Nine Views - EV9V) الجديدة خطوة هائلة إلى الأمام، حيث تضم أكثر من 5,138 مقطع فيديو و910,579 إطاراً.

يُعتبر هذا الرقم إنجازاً كبيراً، حيث يجمع بين تسع مشاهد تخطيط صدى القلب التي تعتبر حيوية في تشخيص مختلف الحالات القلبية. يبرز النموذج المقترح، 'نموذج الدمج الزماني والمكاني' (Spatio-Temporal Fusion Model - STFM)، كأداة قوية لمواجهة التحديات الثلاثة المهمة التي يواجهها التصنيف الآلي.

أولاً، هناك قلة البيانات المتاحة، وثانياً، الأداء المحدود لبعض الهياكل الحديثة لتصنيف الفيديو. وأخيراً، تشابه بعض المشاهد يجعل من الصعب التفريق بينها باستخدام ميزات الإطارات الفردية. نموذج STFM يعتمد على إطار عمل مزدوج يتكون من الشبكات العصبية التلافيفية (CNN) وذاكرة طويلة الأمد القصيرة (LSTM)، مما يمكنه من التقاط الهياكل التشريحية المكانية والديناميكيات القلبية الزمنية بفعالية.

من خلال التعلم المبني على عدم اليقين، يقوم النموذج باختيار مقاطع فيديو تمثيلية خلال التدريب ويجمع الأدلة خلال مرحلة الاستنتاج، وهو ما يُعزز كفاءة تصنيفه حتى مع التباينات في جودة الإطارات.

تظهر التجارب الواسعة أن منهجية الدمج الزماني والمكاني تحقق أداءً تنافسياً مع نماذج تصنيف الفيديو الأخرى، مما يفتح آفاقاً جديدة للتطبيقات السريرية في مجال تخطيط صدى القلب.