في عصر الذكاء الاصطناعي، ظهرت نماذج الرؤية-اللغة الطبية الحديثة (Medical Vision-Language Models) بمثابة ثورة في كيفية توليد التقارير الطبية. ورغم إتقانها لصياغة نصوص طبية سلسة، إلا أن هذه النماذج تعاني من مشكلة خطيرة تُعرف بـ 'انهيار القوالب' (Template Collapse).

تدور هذه المشكلة حول قلة التنوع في المحتوى المولد، حيث تميل النماذج إلى استخدام قوالب عامة تفتقر إلى الإبلاغ عن حالات نادرة لكنها حرجة. هذه الظاهرة تنتج عن مجموعة من القيود الفريدة المتعلقة بتصوير الأشعة ثلاثية الأبعاد، مثل نقص البيانات، وعدم التوازن الشديد في التصنيفات، والاشارات الضعيفة من المحولات الأحجامية (Volumetric Encoders).

لتشخيص هذه المشكلة بشكل منهجي، قام الباحثون بدراسة دقة التقارير السريرية، تنوع المحتوى المولد، والتحيز نحو القوالب الشائعة. وفي استجابة لهذه التحديات، تم اقتراح نظام CLarGen، وهو إطار مفصول يميز بين ما يجب قوله (الكشف السريري) وكيفية قوله (صياغة اللغة).

يستخدم CLarGen عدة تقنيات متقدمة بما في ذلك:
1. **محول الاستعلام الكامن** (Latent Query Transformer) للكشف عن الحالات المرضية المتعددة.
2. **استرجاع مدعوم بالأمراض** (Pathology-Guided Retrieval) للحصول على أمثلة متطابقة سريريًا.
3. **نموذج لغة طبية** (Medical Language Model) لتوليد التقارير النهائية من الاكتشافات والسياقات المسترجعة.

أظهرت نتائج التجارب أن نظام CLarGen نجح في تقليل معدل انهيار القوالب بشكل ملحوظ، مما أدى إلى تحسين كبير في دقة التقارير السريرية (Macro-F1 0.487 مقابل 0.189؛ CRG 0.472 مقابل 0.368) مع الحفاظ على سلاسة التقارير. وتشير النتائج إلى أن وجود أساسيات سريرية واضحة وقابلة للقياس يعد أمرًا أساسيًا لتعزيز توليد التقارير الطبية الثلاثية الأبعاد المقاوم لانهيار القوالب.

ستتوفر الشيفرة البرمجية المعنية عند قبول البحث، مما سيمكن المزيد من الأطراف المعنية من الاستفادة من هذه التقنية المتقدمة.