في ظل الاستخدام المتزايد لنماذج اللغات الكبيرة (Large Language Models) في الممارسات الطبية، تصبح القدرة على تشخيص عدم اليقين بالنسبة لهذه النماذج أمرًا حيويًا. حيث أن معظم الطرق الحالية لقياس عدم اليقين (Uncertainty Quantification) مصممة لتوليد النصوص في مجالات مفتوحة ولا تستطيع تحديد عدم اليقين على مستوى الرموز أو الفقرات في نصوص طبية طويلة.

هنا يأتي دور **Reverse Probing**، وهو أول إطار لقياس عدم اليقين مخصص لتلخيص النصوص الطبية. يقوم هذا النظام بتقدير عدم اليقين على مستوى الرموز مباشرةً من الملخصات المصنفة مسبقًا، بدلاً من محاولة إنتاج مخرجات جديدة. يعتمد Reverse Probing على تحليل النصوص كاختبار لحالة النموذج الداخلية، حيث يقوم باستخراج إشارات عدم اليقين من أربع فئات من التنشيطات الداخلية.

تم تقييم هذا الإطار على مجموعتين من البيانات الطبية المعلّمة من قبل الخبراء، وحقق نتائج أداء متفوقة تتجاوز ثمانية قواعد تم تعديلها، حيث حقق نسبة دقة أعلى تصل إلى أربع مرات في مقياس AUPRC، مع تقليل وقت الاستنتاج والتكاليف الحاسوبية.

أظهرت تحليلات الميزات أن طاقة التغير وسياق الجوار تعد من المتنبئات الأكثر اتساقًا عبر جميع النماذج. هذه الدراسة تقدم رؤى مفيدة حول كيفية استجابة النماذج لمحتوى طبي غير مدعوم بشكل داخلي، مما يعزز فهمنا لكيفية تحسين الخدمات الطبية المستندة إلى الذكاء الاصطناعي.