تظل أمراض الشرايين التاجية (Coronary Artery Disease) من الأسباب الرئيسية للوفاة على مستوى العالم، مما يبرز الحاجة الملحة إلى أنظمة تنبؤية موثوقة تدعم التشخيص المبكر وتقييم المخاطر. في الوقت الذي تبلي فيه نماذج التعلم الآلي التقليدية بلاءً حسنًا في التعامل مع البيانات السريرية الهياكل، تفتح نماذج اللغة الكبيرة (Large Language Models) آفاقًا جديدة لفهم المعلومات الطبية المعبر عنها باللغة الطبيعية.

في هذا الإطار، تم تطوير نموذج هجين يربط بين البيانات السريرية الهياكل والتعبيرات الطبيعية للتوقع بمخاطر الإصابة بأمراض الشرايين التاجية. تم استخدام مجموعة بيانات عامة تضم 1,190 سجلًا طبيًا مع 11 سمة سريرية مختلفة، حيث تم تحويل المتغيرات الهيكلية إلى تمثيلات قابلة للتفسير ورويات سريرية اصطناعية عبر نماذج اللغة الكبيرة.

تمت معالجة البيانات من خلال أنبوب تحقق يقوم بإعادة استخراج المتغيرات السريرية وحساب درجة التناسق مع السجلات الأصلية، حيث حقق هذا النظام متوسط دقة بلغ 94.61%. وُقُيِّمت أربعة نماذج تقليدية للتعلم الآلي، وتمت مقارنتها مع تصنيف يعتمد على نماذج اللغة الكبيرة في أوضاع مختلفة من التقديم.

تم استخدام نموذجين من نماذج اللغة الكبيرة وهي GPT وGemini. أظهرت النتائج التجريبية أن نموذج Random Forest حقق أعلى دقة، ومع ذلك فإن تصنيف نماذج اللغة الكبيرة يبقى له فوائد في البيئات السريرية الحقيقية، حيث يتعامل مباشرة مع أوصاف المرضى باللغة الطبيعية، مما يحفظ البيانات الحساسة، كالقيم العددية المخبرية وضغوط الدم، مما يعزِز من خصوصية المعلومات.

تشير هذه النتائج إلى أن دمج البيانات السريرية الهيكلية مع الروايات التي تم إنشاؤها بواسطة نماذج اللغة الكبيرة يمكن أن يفتح آفاقًا جديدة لنظم التنبؤ السريرية الهجينة ويدفع بتطور هذا المجال إلى الأمام بشكل ملحوظ.