تشهد نماذج اللغات الضخمة (LLMs) تطورات ملحوظة في أداءها في العديد من المهام اللغوية، ولكن تبقى فعالية هذه النماذج في مهام التفكير، وخاصة المتعلقة بسلاسل الاستدلال الطويلة، موضوعاً للبحث والنقاش. في دراسة حديثة، تم تقييم أداء هذه النماذج في أبسط مهام التفكير الطويل، وهي مسألة فئات التكافؤ (Equivalence Class Problem).

تسعى مسألة فئات التكافؤ إلى تحديد ما إذا كانت متغيرتان متساويتان باستخدام مجموعة من العلاقات التكافئية المُولدة عشوائياً.

شملت الدراسة نماذج متنوعة من LLMs، بعضها يُمثل التفكير وبعضها لا. وقد أظهرت النتائج أن النماذج غير القادرة على التفكير تعاني بشكل كبير في هذه المهمة، بينما تُظهر النماذج المعتمدة على التفكير أداءً محسناً، لكنها لا تزال تواجه صعوبة في حل جميع حالات الاختبار.

ومن المثير للاهتمام أن الدراسة استكشفت تأثير احتمالات الاتصال مع عدد ثابت من المتغيرات، حيث يتوافق أصعب الحالات لدى النماذج غير القادرة على التفكير مع نقطة انتقال المرحلة، مما يدل على فوضى المشكلة. في المقابل، بالنسبة للنماذج المعتمدة على التفكير، فإن الحالات الأكثر صعوبة تتعلق بأكبر قطر، مما يشير إلى تعقيد التفكير المطلوب.

تسلط هذه النتائج الضوء على التحديات التي لا تزال تواجه نماذج اللغات الضخمة في عالم التفكير المعقد، مما يجعلنا نتساءل: هل سنشهد تحسناً في قدرات هذه النماذج في المستقبل القريب؟