في عصر تزايد الاعتماد على النماذج اللغوية الكبيرة (Large Language Models) للإجابة على أسئلة علمية مثيرة للجدل، تنشأ قلقيات بشأن كيفية استجابتها عندما يشكك المستخدم في الحقائق العلمية الثابته. هل ستتراجع هذه النماذج في المصداقية لتقويض التوافق العلمي وتسمح بنقل أفكار خاطئة تحت مبدأ التوازن الخاطئ؟

للكشف عن ذلك، أجريت دراسة حديثة على ثلاثة نماذج مفتوحة (Llama-3.1-8B وQwen2.5-7B وMistral-7B) في ثلاثة مجالات علمية متوقعة (المناخ، اللقاحات، والتطور)، وتم تحليل تفاعل هذه النماذج في كل من حالات السؤال المباشر والمتعدد.

أظهرت النتائج أن هذه النماذج لا تتراجع بشكل ينم عن الممالأة. بل، أقر الباحثون وجود ثلاث سياسات مختلفة تحت الضغوط السلبية:

1. **التحقق العدواني (Reactive Assertion)**: حيث تزداد التأكيدات على الإجماع بدلاً من أن تنقص (كما في نموذج Llama).
2. **التحفظ السطحي (Surface Hedging)**: حيث يخف الصوت ولكن الموقف يظل ثابتًا (كما يظهر في نموذج Qwen).
3. **عدم الاستجابة (Non-response)**: كما هو الحال في نموذج Mistral.

أكدت الأحكام الزوجية أن التحول في نموذج Llama هو في الأسلوب وليس في المضمون، بالرغم من أن النماذج تظهر استجابة متباينة.

على الرغم من هذه الموثوقية، إلا أنها ليست متساوية عبر المجالات. وفي مجال اللقاحات الحساس، يمكن أن تنعكس هذه النتائج، مما يؤدي إلى ضعف الردود الموجهة ضد الأساطير تحت الضغط الشكي.

تستنتج الدراسة أن الفهم السلوكي وحده لا يمكن أن يميز بين نموذج يقاوم الشكوك لأنه يفهم الإشارة، وآخر يبدو أنه يقاوم لأنها تفشل في إدراكها.

هل تعتقد أن النماذج اللغوية قادرة على التعامل مع الشكوك العلمية بشكل أفضل في المستقبل؟ شاركونا آرائكم في التعليقات!