أصبح الاعتماد على النماذج اللغوية الضخمة (Large Language Models) في تقييم سرد الاستدامة البيئية والاجتماعية (ESG) أمراً شائعاً، لكن تساؤلات كثيرة تدور حول مدى فعالية هذه النماذج ذات التفكير الثقيل مقارنة بتكلفتها. في دراسة جديدة تناولت عشرة شركات مدرجة في السوق اليابانية، تم تقييم أداء النموذج الذي يعتمد على التفكير الثقيل ومقارنته مع ثلاثة نماذج أخرى لا تعتمد على هذا النوع من التفكير.

النموذج الثقيل حقق نتائج متقاربة جداً مع النماذج الأخرى، حيث كانت الفروقات في النقاط لا تتجاوز 0.38 على مقياس من 5 نقاط. المفاجأة كانت في أن 2% فقط من المقارنات بين النماذج أظهرت اختلافاً قدره نقطتين، بينما لم تتجاوز أي مقارنة هذا الفارق. والملفت أن تكلفة النموذج الثقيلة كانت تساوي تقريباً 5.6 مرات تكلفة مجموع النماذج الثلاث الأخرى.

تصلح نتائج هذه الدراسة للجدل حول استخدام النماذج الثقيلة في تقييمات ESG، حيث أثبتت أنها لم تقدم تحسينات ملحوظة في النتائج بينما زادت في نفس الوقت التكاليف التشغيلية. هذا يعني أن الجهات التي تعتمد على تقييم الاستدامة قد تحتاج لإعادة التفكير في استراتيجياتها وتقديراتها.

فما رأيكم في نتائج هذه الدراسة؟ هل تعتقدون أن النماذج التقليدية أفضل من تلك الثقيلة من حيث الكفاءة والتكلفة؟ شاركونا آراءكم في التعليقات!