في عالم الذكاء الاصطناعي، أصبحت النماذج اللغوية الضخمة (Large Language Models) أدوات رئيسية لمحاكاة السلوك البشري في بيئات اتخاذ القرار المعقدة. ومع تزايد الاعتماد على هذه النماذج، يطرح الباحثون سؤالاً مهماً: هل تتمتع النماذج اللغوية الضخمة بنفس سلوك اتخاذ القرار الذي يتمتع به البشر؟

تتناول دراسة جديدة مشكلة توازن الاكتشاف والاستغلال (Exploration-Exploitation, E&E)، وهو ما يُعد جانباً أساسياً في اتخاذ القرار الديناميكي تحت ظروف عدم اليقين. من خلال تجارب مثيرة تعتمد على فكرة "آلات متعددة الذراعين" (Multi-armed Bandit, MAB)، تم إجراء مقارنة بين استراتيجيات E&E لكل من النماذج اللغوية الضخمة، والبشر، والخوارزميات التقليدية.

تستند الدراسة إلى نماذج اختيار قابلة للتفسير يتم استخدامها لالتقاط استراتيجيات E&E للوكالات المختلفة. كان من المثير للاهتمام أن نكتشف أن تعزيز "أثر التفكير" من خلال استراتيجيات التحفيز ونماذج التفكير قد أثّر بشكل كبير على اتخاذ القرارات من قبل النماذج اللغوية الضخمة، حيث بدأت تميل إلى سلوكيات تشبه البشر، مع مزيج من الاكتشاف العشوائي والموجه.

في إطار بيئة ثابتة بسيطة، أظهرت النماذج اللغوية الضخمة المعززة بالتفكير مستويات مشابهة من الاكتشاف العشوائي والموجه مقارنة بالبشر. ومع ذلك، في بيئات غير مستقرة ومعقدة، وجدت الدراسة أن النماذج اللغوية الضخمة تواجه تحديات في التكيف مع هذه البيئات، خصوصاً في الاكتشاف الموجه الفعّال. ورغم أن النماذج حققت مستويات مماثلة من الندم في بعض السيناريوهات، إلا أن قدرتها على التكيف لم تصل إلى مستوى البشر.

تسلط هذه النتائج الضوء على الإمكانيات والحدود التي تمتلكها النماذج اللغوية الضخمة كأدوات لمحاكاة السلوك البشري وأدوات اتخاذ القرار الآلي، وتشير إلى مجالات محتملة لتحسين أدائها في المستقبل.