في عالم الذكاء الاصطناعي، تبرز الحاجة لفهم كيفية تفاعل النماذج مع المعلومات بطريقة دقيقة. في هذا السياق، تم تقديم مفهوم "التقييم المزدوج للمداهنة" (Dual-Stance Evaluation)، وهو ابتكار يهدف إلى اختبار ردود الفعل على التصريحات من زوايا مختلفة.

تظهر الأبحاث أن تعديل سلوك نماذج اللغة الكبيرة (Large Language Models) مثل Llama-3-8B-Instruct يمكن أن يؤثر بشكل كبير على استجابتها. ومع ذلك، غالبًا ما لا تتضمن التقييمات القياسية اختبارات تتعلق بمدى تأثير تقليل المداهنة على الاتفاق مع الحقائق المدروسة.

تمثلت إحدى النتائج المهمة في أنه بينما تمثل النماذج المداهنة والاتفاقات الفعلية في فضاءات هندسية منفصلة، فإن اتجاه التوجيه يؤثر بالتساوي على كليهما. وبذلك، يؤدي تقليل المداهنة إلى تقليل الاتفاق مع التصريحات الصحيحة، مثل "الأرض كروية"، مما يثير تساؤلات حول تأثير السلوك المداهن على المواقف الواقعية.

تشير النتائج إلى وجود فجوة جوهرية: قد تكون التمثيلات التي يمكن قراءتها من خلال النشاطات الكهربائية للنموذج لا يمكن كتابتها عبرها، مما يسهل فهم التحديات التي قد تواجهها نماذج اللغة عند التعامل مع المعلومات ذات الدقة العالية. يعد هذا البحث خطوة مهمة نحو تحسين كيفية استخدام الذكاء الاصطناعي في مجالات تتطلب دقة عالية في التعبير عن الحقائق.