تعد القدرة على فهم التقارير الطبية من الصور الوثائقية الحقيقية جانباً أساسياً في تحسين تفاعل المرضى مع معلوماتهم الصحية وتسهيل تبادل البيانات في الأنظمة السريرية. في هذا السياق، تم تقديم معيار MedRepBench، والذي يشتمل على مجموعة من 1,925 صورة لتقارير طبية صينية تم إخفاء هوية أصحابها، تغطي مجموعة متنوعة من الأقسام والفئات السكانية وأساليب الاكتساب.

يتوجه التركيز في MedRepBench إلى التفسير القائم على التقرير بدلاً من تقييم التفكير التشخيصي أو توصيات العلاج. يتم تعريف التفسير على أنه استخراج منظم لمجالات التقرير مثل عنصر التقرير، القيمة، الوحدة، النطاق المرجعي وإشارة الشذوذ، بالإضافة إلى تفسير يمكن للمرضى فهمه مستندًا بشكل مباشر إلى محتوى التقرير.

تقدّم المعايير آلية تقييم جديدة تشمل بروتوكولين تكميلين: (1) بروتوكول موضوعي يقيس مستوى استرجاع العناصر الهيكلية، و(2) بروتوكول ذاتي آلي يستخدم نموذج لغة لتقييم الحقائق وقابلية التفسير وجودة reasoning تحت طلب ثابت. باستخدام المقياس الموضوعي كإشارة مكافأة، تم تقديم معيار قائم على GRPO بهدف تحسين مستوى استرجاع البيانات بمقدار يصل إلى 6%.

علاوة على ذلك، تتطرق الدراسة إلى القيود العملية لخطوط أنابيب OCR ونماذج اللغة، بما في ذلك الأخطاء المرتبطة بالتخطيط وزيادة زمن الانتظار للنظام، مما يظهر الحاجة إلى فهم تقارير طبية قائم على رؤية شاملة. فوراً بوسع الباحثين والمهتمين الوصول إلى مجموعة البيانات والموارد من خلال الرابط المتاح.