تعتبر النماذج اللغوية الكبيرة (Large Language Models - LLMs) من الأدوات المتقدمة التي تستخدم في تحليل البيانات واتخاذ القرارات، وخاصة في مجالات تقييم السياسات. ولكن هل يمكن الاعتماد عليها تماماً في هذا السياق؟ تكشف دراسة جديدة عن جوانب مثيرة للاهتمام تتعلق بدور البديهة في أداء هذه النماذج.

تم إعداد معيار يتكون من 40 حالة تقييم سياسة مأخوذة من مجالات الاقتصاد وعلم الاجتماع، حيث تم تصنيف كل حالة بحسب درجة بديهتها. استخدمت الدراسة أربع نماذج لغة متقدمة، مع تطبيق خمس استراتيجيات تحفيزية، لتجري تجارب شملت 8000 اختبار.

نتائج الدراسة كانت مدهشة:
1. ظهرت ``مفارقة سلسلة التفكير`` (Chain-of-Thought Paradox)، حيث تحسن الأداء في الحالات البديهية بشكل كبير، ولكن هذا التحسن تقلص في الحالات المتعارضة للبديهة.
2. أثبتت الدراسة أن البديهة تلعب دورًا محوريًا في دقة النتائج، حيث تفوقت على تأثير اختيار النموذج أو استراتيجية التحفيز.
3. لوحظ انفصال بين المعرفة والاستدلال، مما يعني أن النماذج تمتلك المعرفة اللازمة ولكنها تفشل في استخدامها عند وجود تناقض مع البديهة.

من منظور نظرية العمليات الثنائية (Dual-Process Theory)، تشير النتائج إلى أن التفكير البطيء الذي تتمتع به النماذج الحالية لا يزال غير كافٍ لتحفيز استدلال دقيق، مما يقودنا للتساؤل عن كيفية تحسين هذه المنظومات.

في عالم يتزايد فيه الاعتماد على الذكاء الاصطناعي، تمثل هذه النتائج دعوة للتفكير العميق حول كيفية بناء نماذج أكثر كفاءة وموثوقية. ما رأيكم في هذا التطور؟ شاركونا في التعليقات.