أصبح الاعتماد على النماذج اللغوية الضخمة (Large Language Models) في تقييم سرد الاستدامة البيئية والاجتماعية (ESG) أمراً شائعاً، لكن تساؤلات كثيرة تدور حول مدى فعالية هذه النماذج ذات التفكير الثقيل مقارنة بتكلفتها. في دراسة جديدة تناولت عشرة شركات مدرجة في السوق اليابانية، تم تقييم أداء النموذج الذي يعتمد على التفكير الثقيل ومقارنته مع ثلاثة نماذج أخرى لا تعتمد على هذا النوع من التفكير.
النموذج الثقيل حقق نتائج متقاربة جداً مع النماذج الأخرى، حيث كانت الفروقات في النقاط لا تتجاوز 0.38 على مقياس من 5 نقاط. المفاجأة كانت في أن 2% فقط من المقارنات بين النماذج أظهرت اختلافاً قدره نقطتين، بينما لم تتجاوز أي مقارنة هذا الفارق. والملفت أن تكلفة النموذج الثقيلة كانت تساوي تقريباً 5.6 مرات تكلفة مجموع النماذج الثلاث الأخرى.
تصلح نتائج هذه الدراسة للجدل حول استخدام النماذج الثقيلة في تقييمات ESG، حيث أثبتت أنها لم تقدم تحسينات ملحوظة في النتائج بينما زادت في نفس الوقت التكاليف التشغيلية. هذا يعني أن الجهات التي تعتمد على تقييم الاستدامة قد تحتاج لإعادة التفكير في استراتيجياتها وتقديراتها.
فما رأيكم في نتائج هذه الدراسة؟ هل تعتقدون أن النماذج التقليدية أفضل من تلك الثقيلة من حيث الكفاءة والتكلفة؟ شاركونا آراءكم في التعليقات!
دراسة جديدة تكشف عن فائدة محدودة لنماذج الذكاء الاصطناعي في تقييم الاستدامة البيئية والاجتماعية
تظهر دراسة حديثة أن النماذج الثقيلة في التفكير على الذكاء الاصطناعي لا تضيف قيمة كبيرة لتقييم السرد البيئي والاجتماعي. رغم تكلفتها العالية، الكفاءة تظل قريبة من النماذج التقليدية.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
