في عالم الرعاية الصحية، أصبحت القرارات السريرية جزءًا لا يتجزأ من سير العمل العملي، حيث يستند الأطباء إلى معلومات غير كاملة لتشخيص الحالات واختيار العلاجات. ومع تزايد استخدام نماذج اللغات الضخمة (Large Language Models أو LLMs)، يظهر السؤال: هل يمكن الاعتماد على هذه النماذج في اتخاذ قرارات طبية سليمة بدلاً من الاعتماد على الخبرة البشرية فقط؟

لملء هذا الفراغ، تم تقديم EHRBench، معيار مبتكر مصمم خصيصًا لتقييم نماذج اتخاذ القرارات السريرية المستندة إلى السجلات الصحية الإلكترونية. يهدف EHRBench إلى توفير معيار عالمي وموثوق يمكنه اختبار فعالية هذه النماذج في سياقات حقيقية، مستفيدًا من البيانات المتاحة في السجلات الصحية.

**ما هو EHRBench؟**
EHRBench هو معيار آلي يعتمد على البيانات السريرية الحقيقية، حيث تم تصميمه باستخدام تفاعل بين السجلات الصحية (EHR) ونموذج اللغات الضخمة (LLM) وقاعدة المعرفة (Knowledge Base). هذا يعني أنه يضمن جودة البيانات ويحول المعلومات السريرية إلى تنسيقات قابلة للاستخدام في الاختبارات السريرية.

**العمليات الأساسية**
يعمل EHRBench على تحويل البيانات المسجلة لأحداث الرعاية الصحية إلى قوالب منظمة، مما يتيح إنشاء ما يقارب من 1 مليون عنصر أسئلة وأجوبة (QA) تغطي ثلاثة مهام سريرية أساسية: التشخيص، العلاج، والتنبؤ بالمستقبل. كما يتم استخدام التحقق والتغ enriquecido عبر قاعدة المعرفة لتحسين موثوقية المعلومات الناتجة، مما يقلل من فرص الوقوع في أخطاء ناجمة عن سوء الفهم أو التضليل.

**نتائج مثيرة للاهتمام**
من خلال اختبار أكثر من 30 نموذجًا تمثل LLMs على EHRBench، كشفت النتائج عن اتجاهات مثيرة تبرز موثوقية النظام الجديد. لا تقتصر فوائد EHRBench على تحسين أداء النماذج، بل تساعد أيضًا في تحديد الثغرات المحتملة التي تتطلب تحسينات إضافية لدعم القرارات السريرية بشكل أفضل.

إليك الأمل: في المستقبل، سيتمكن الأطباء من استخدام هذه الأنظمة بشكل موثوق، مما يؤدي إلى تحسين جودة الرعاية الصحية وتقليل الأخطاء.