في عصر الذكاء الاصطناعي، تولي المؤسسات [الطبية](/tag/الطبية) اهتمامًا متزايدًا لتطبيق [نماذج [اللغات](/tag/اللغات) الضخمة](/tag/[نماذج](/tag/نماذج)-[اللغات](/tag/اللغات)-الضخمة) (Large Language [Models](/tag/models)) في [تحسين](/tag/تحسين) جودة الوثائق السريرية. لكن كيف يمكن [تقييم جودة](/tag/[تقييم](/tag/تقييم)-جودة) النصوص السريرية المولدَة؟
تتطرق دراستنا إلى [تقييم](/tag/تقييم) شامل للملاحظات السريرية التركيبية التي تم إعادة صياغتها باستخدام [نماذج اللغات](/tag/[نماذج](/tag/نماذج)-[اللغات](/tag/اللغات)) الضخمة، حيث يتضمن هذا [التقييم](/tag/التقييم) ثلاثة جوانب رئيسية: [التقييم](/tag/التقييم) الداخلي (Intrinsic [Evaluation](/tag/evaluation))، [التقييم الخارجي](/tag/[التقييم](/tag/التقييم)-الخارجي) (Extrinsic [Evaluation](/tag/evaluation))، وتقييم الحقائق (Factuality [Evaluation](/tag/evaluation)).
تستند هذه [الدراسة](/tag/الدراسة) على [قاعدة بيانات](/tag/قاعدة-[بيانات](/tag/بيانات)) MIMIC، حيث قمنا بتحليل مليون ملاحظة سريرية. أظهرت النتائج أن الملاحظات التركيبية قادرة على الحفاظ على [المعلومات](/tag/المعلومات) الأساسية والقدرة التنبؤية للتطبيقات الكبيرة، على الرغم من [تغييرات](/tag/تغييرات) لغوية كبيرة. لكن، لوحظ فقدان بعض التفاصيل الدقيقة، خاصةً في المهام مثل [تشفير](/tag/تشفير) ICD.
للتغلب على هذا الفقدان، استنتجنا أن إعادة صياغة الملاحظات على شكل أجزاء بدلاً من [الملاحظة](/tag/الملاحظة) الكاملة قد تقلل من الضياع في التفاصيل، على الرغم من أنها قد تقلل أيضًا من [الدقة](/tag/الدقة) بفعل نقص [السياق](/tag/السياق). من خلال [التحليل](/tag/التحليل) الدقيق للأخطاء، اكتشفنا أن [أخطاء](/tag/أخطاء) الإنتاج غالبًا ما تعود لسوء [فهم](/tag/فهم) [السياق](/tag/السياق) السريرى، إضافة إلى الارتباك الزمني، وأخطاء القياس، والمزاعم المفبركة.
بالرغم من أن الملاحظات التركيبية تُظهر طبيعة غير مخصصة للمهام، إلا أنها أثبتت فعاليتها في تعزيز [التدريب](/tag/التدريب) الخاص بالمهام النادرة مثل [تشفير](/tag/تشفير) ICD. هذه النتائج تعكس أهمية ودور [نماذج [اللغات](/tag/اللغات) الضخمة](/tag/[نماذج](/tag/نماذج)-[اللغات](/tag/اللغات)-الضخمة) في [تحسين](/tag/تحسين) [منتجات](/tag/منتجات) [الرعاية الصحية](/tag/الرعاية-الصحية).
في ختام هذا [التقييم](/tag/التقييم) الشامل، يُظهر لنا [الذكاء الاصطناعي](/tag/الذكاء-الاصطناعي) تقييمًا مذهلاً يمكن أن يُحدث ثورة في كيفية تعاملنا مع [البيانات السريرية](/tag/[البيانات](/tag/البيانات)-السريرية). ما هي آراؤكم حول إمكانية استخدام [الذكاء الاصطناعي](/tag/الذكاء-الاصطناعي) في [توليد](/tag/توليد) [نصوص طبية](/tag/[نصوص](/tag/نصوص)-[طبية](/tag/طبية))؟ شاركونا تجاربكم في [التعليقات](/tag/التعليقات).
تقييم شامل لجودة الملاحظات السريرية التركيبية بواسطة نماذج اللغات الضخمة: تحليل على نطاق مليون ملاحظة
تقدم دراستنا تقييمًا شاملاً لجودة الملاحظات السريرية التي تولدها نماذج اللغات الضخمة، حيث تتمتع هذه الملاحظات بقدر عالٍ من الدقة في المعلومات الأساسية، إلا أنها فقدت بعض التفاصيل الدقيقة. تابعوا معنا لاستكشاف النتائج المثيرة!
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
