في السنوات الأخيرة، أصبح دمج النماذج اللغوية الضخمة (Large Language Models) في أدوار دعم القرار في مجالات الأعمال والسياسة أمراً شائعاً، ولكن هل تؤثر هذه النماذج على كيفية اتخاذ القرارات بشكل يتجاوز مجرد تقديم النصائح؟

دراسة جديدة فحصت ما يُعرف بـ"الحذر السببي"، وهو ميل النماذج إلى التوقف عن إصدار أحكام سببية عندما تكون الأدلة التجريبية غير كافية. من خلال استخدام تقييم مستوحى من تسلسل الحذف السببي (Causal Hierarchy) لبرل، أُجري تحليل على أربعة نماذج لغوية متقدمة: كلود سونيت 4.6، كلود أوبس 4.7، جي بي تي 5.5، وجمني 3.1 برو، عبر 480 تجربة.

نتائج الدراسة كانت مذهلة؛ حيث بلغت معدلات الحفاظ على الحذر السببي 91.7% إلى 100% في السياقات الأكاديمية، لكن هذه النسبة انخفضت إلى 6.7% إلى 18.3% فقط في السياقات الاستشارية. وعندما تم طلب إجابات محددة أو تفسيرات، احتفظ 1 من 200 رد فقط بحذر سببي، مما يدل على أثر السياق في هذه النماذج.

ومع ذلك، أظهرت التجربة أن تنبيهاً بسيطاً مثل"يرجى إعادة النظر في هذا الحكم من منظور العلاقات السببية" يمكن أن يعيد معدلات الحذر إلى 71.4% إلى 100%، مما يجعل من الضروري أن نفكر في التصميمات الحوكمة التي تفصل بين اقتراحات النماذج وتدقيق القضايا السببية.

تظهر هذه النتائج أن الأساليب الاستشارية الموجهة نحو المساعدة قد تمنع النماذج من التعبير عن حذرها السببي في الظروف العملية، مما يعكس تنوع السياق في التعبير بدلاً من قيود القدرة الأساسية. هذه الفروق تطرح تساؤلات كبيرة حول كيفية اعتماد المنظمات على هذه النماذج في اتخاذ القرارات الهامة.