شهدت الآونة الأخيرة فوائد كبيرة من تطوير نماذج اللغة المعززة بالاسترجاع، التي تهدف إلى توصيل مخرجات أكثر دقة مستندة إلى أدلة خارجية. على الرغم من ذلك، لا تزال هذه التقنية تعاني فجوة ملحوظة تعرف بـ"بقعة العمى في النسب"، حيث يصعب التحقق مما إذا كان السياق المسترجع بالفعل يؤثر على مخرجات النموذج.

عادةً ما يُفترض أن مخرجات متسقة مع السياق تعني أن هذا السياق قد أثر على الإنتاجية، لكن هذه الفرضية تنهار عندما تتداخل الوثائق المسترجعة مع بيانات تدريب النموذج السابقة. في مثل هذه الحالات، يمكن للنموذج إنتاج نصوص مشابهة تمامًا اعتمادًا على ذاكرته التقليدية بدلاً من الاستناد إلى السياق المسترجع، مما ينتج عنه مخرجات تظل غير قابلة للتمييز.

لمعالجة هذه المعضلة، تم تقديم مفهوم جديد يُدعى "مراقبة الواقع الحاسوبي" (Computational Reality Monitoring)، وهو يتبنى مبدءًا مستمدًا من علوم الإدراك. يركز هذا المفهوم على مقارنة التمثيلات الداخلية للنموذج مع وبدون سياق مسترجع، مما يكشف عن تباين تمثيلي مشروط لا يمكن رصده من خلال المراقبين الموجودين على مستوى المخرجات.

لا يحدد هذا النظام أي مصدر تم استخدامه في إنتاج نص معين، ولكنه يكشف ما إذا كانت التعرضات السابقة للتدريب تترك بصمة داخلية قابلة للقياس، مما يساهم في إنشاء قاعدة ضرورية للتأكيد على مصادر النسب في المستقبل. من خلال تحليل تسعة نماذج مختلفة تعكس ثلاثة عائلات، يركز التباين في أنماط معينة ضمن الطبقات المعمارية، ويحصل على دعم متقارب من تدخل الضوضاء على المستوى الكتلي. جدير بالذكر أيضًا أن هذه النتائج تُظهر عمومية عبر المهام ومجموعات البيانات، بينما تنهار عند المعايير المتداخلة في المجالات.

إن "بقعة العمى في النسب" قابلة للقياس وقابلة جزئياً للتصحيح، مما يشكل نموذجاً يمكن من خلاله للنماذج الحصول على الوعي الداخلي بمصدر الأدلة الذي يوجه سلوكها الخارجي.