تصميم الدراسة">تصميم الدراسة
استخدم الباحثون مجموعة بيانات MIMIC-IV التي تتضمن 13,645 حالة دخول، وتم تجميع البيانات وفقًا لعشرة رموز ICD-10 الأكثر شيوعًا، والتي تم تصنيفها إلى سبع فئات. تم تحويل المتغيرات الهيكلية إلى روايات إكلينيكية ودمجها مع ملاحظات تفريغ مصححة من التسرب.
النتائج">النتائج
وباستخدام نموذج MedFound-Llama3-8B مع تعديل مسبق، استطاع الباحثون استخلاص الحالات المخفية من خمسة طبقات من نماذج التحويل، وتدريب متغيرات خطية لمقارنة البيانات الهيكلية فقط، والبيانات غير الهيكلية، والمدخلات المشتركة. كانت نتائج الاختبارات مشجعة، حيث تفوق نموذج الفحص المشترك بنسبة دقة طبية بلغت 91.45%، متجاوزًا جميع النماذج الأخرى.
مناقشة
تظهر النتائج أن نماذج LLM يمكن أن توحد المعلومات الهيكلية وغير الهيكلية من السجلات الصحية الإلكترونية، مما يدعم إعادة استخدام التمثل السريري بكفاءة. تعد هذه النتائج خطوة نحو تحسين دقة تشخيص الأمراض، مما يمكن الأطباء من اتخاذ قرارات أكثر فعالية.
خلاصة
تظهر الدراسة أن الفحص متعدد الوسائط باستخدام نماذج اللغة الطبية يوفر نهجًا عمليًا لدراسة وتكيف التمثيلات السريرية عبر مجموعات البيانات المختلفة.
