في عالم الطب الحديث، يُعتبر إعادة بناء المسارات السريرية بدقة أمراً ضرورياً لتحليل حالات المرضى وتوقع المخاطر. لكن يواجه هذا التحدي صعوبة في التعامل مع روايات سريرية غير منظمة، حيث تفتقر هذه الروايات غالبًا إلى الدقة الزمنية اللازمة، بينما توفر السجلات الصحية الإلكترونية (Electronic Health Records - EHR) نقاط زمنية دقيقة، لكنها تتجاهل العديد من الأحداث السريرية الهامة.

لذلك، تم تقديم إطار عمل جديد يعتمد على الاسترجاع المعزز بخاصية التوافق المتعدد الوسائط، والذي يسد الفجوة بين هذين المصدرين لتحسين الدقة الزمنية للمسارات السريرية المستخرجة من النصوص. هذا الاقتراح يمكن أن يُعتبر كعملية متعددة الخطوات تعتمد على الرسوم البيانية، حيث يقوم أولاً باستخراج الأحداث المركزية من الروايات لبناء هيكل زمني أولي، ثم يُضيف الأحداث غير المركزية بالنسبة لهذا الهيكل، وأخيرًا يقوم بمعايرة الجدول الزمني باستخدام السجلات الصحية المنظمة كأدلة زمنية خارجية.

تم تقييم هذا النهج باستخدام نماذج لغوية كبيرة (Large Language Models) محسّنة وفقاً للتعليمات على معيار i2m4، الذي يشمل مجموعة البيانات MIMIC-III وMIMIC-IV. وأظهرت النتائج أن الطريقة المتعددة الوسائط تعزز بشكل مستمر دقة الطوابع الزمنية المطلقة (Absolute Timestamp Accuracy - AULTC) وتحسن التوافق الزمني بين النماذج المدروسة، مما يتجاوز الأداء الناتج عن الاعتماد فقط على البيانات النصية.

والأكثر إثارة هو أن التحليل التجريبي أظهر أن 34.8% من الأحداث المستخرجة من النصوص غير موجودة تمامًا في السجلات الجدولية، مما يثبت أن التوافُق بين هذين المصدرين يمكن أن يُنتج إعادة بناء أكثر دقة وإفادة من المسارات السريرية للمرضى مقارنة باستخدام كل مصدر على حدة.

إذًا، ما تأثير هذه الابتكارات على مستقبل الطب؟ وكيف يمكن أن تُحدث تحولاً في معالجة البيانات السريرية؟ شاركونا آراءكم في التعليقات!