في عالم مليء بالتعقيدات، يبدو أن نماذج اللغة الضخمة (Large Language Models) يمكن أن تلعب دورًا أكبر مما تصورناه. دراسة جديدة تحت عنوان “CEO-Bench” قامت بتقييم قدرات هذه النماذج على اتخاذ القرارات الاستراتيجية وكأنها في مناصب تنفيذية. ولكن، هل تستطيع حقاً تجاوز التحديات المرتبطة بهذا الدور؟

تقليديًا، كانت التقييمات تركز على مهام معرفية معزولة مثل التفكير المنطقي واسترجاع المعرفة، مما يسرق نماذج الذكاء الاصطناعي من واحدة من أكبر التحديات في اتخاذ القرار التنفيذي: كيفية دمج توصيات متعارضة من أصحاب المصلحة المتخصصين في ظل ظروف عدم اليقين.

دراسة “CEO-Bench” تطلق مجموعة معيارية متعددة الوكلاء تقيّم الأداء الاستراتيجي لنماذج اللغة الضخمة في إعادة تخصيص الموارد الاستراتيجية. يتلقى الوكلاء الذكيون آراء متناقضة من أربعة مستشارين تنفيذيين (CFO، CTO، COO، وCMO)، كل منهم لديه أولويات وتوجهات خاصة، مما يضعهم في صميم عملية صنع القرار.

النتائج التي حصلت عليها الدراسة من خمسة نماذج رائدة عبر 13 سيناريو تُظهر أن جميع النماذج تحقق صلاحية هيكلية عالية، لكنها تختلف بشكل حاد في دقة التقدير الاستراتيجي. تم الكشف عن بعض أوجه الفشل النظامية مثل استحواذ مستشار واحد، التحفظ الافتراضي في أوقات الضبابية، وفقدان الذاكرة التاريخية.

تشير هذه النتائج إلى حدود القدرات الحالية لنماذج اللغة الضخمة كصناع قرار في المؤسسات، وتسلط الضوء على ضرورة الموازنة بين عمق الدمج مع الآراء المتناقضة والقدرة على اتخاذ قرارات حاسمة. كما أن هذه الدراسة تقدم رؤى هامة لتصميم أنظمة مستقبلية لتكنولوجيا الذكاء الاصطناعي.

ما رأيكم في إمكانية استخدام الذكاء الاصطناعي في اتخاذ قرارات استراتيجية على مستوى قيادي؟ شاركونا في التعليقات.