في عالم الذكاء الاصطناعي، تعتبر القدرة على تقييم الذات والتعرف على الحدود الشخصية سمة أساسية لأي نظام ذكي موثوق. ومع ذلك، يكشف بحث حديث أن نماذج اللغات الضخمة (Large Language Models) تعاني من نقص في هذه المهارة الحيوية. حيث أظهرت هذه النماذج، عبر عدة عائلات وأحجام، ميلها للمبالغة في تقدير كفاءاتها، مما يدفعها لمحاولة حل مسائل تفوق قدرتها الفعلية.

تُعرف هذه القدرة، التي يعتبرها الباحثون محورية، بتقييم القدرات الذاتية (Capability Self-Assessment - CSA). ولتحسين هذه الفجوة، قام الباحثون بإعادة صياغة المشكلة كمسألة تعلم سياسة، تهدف إلى تعزيز عملية التقييم الذاتي مع الحفاظ على الكفاءات الأصلية للنموذج.

تشير النتائج إلى أن التعلم التعزيزي يعزز من CSA بشكل فعال، متفوقًا بشكل ملحوظ على طرق التحسين الخاضعة للإشراف، والتي غالبًا ما تؤثر سلبًا على القدرات التي يسعى النموذج لتقييمها. وحتى أكثر إثارة، تبين أن سلوكيات التقييم الذاتي التي تم تعلمها تعمم بشكل جيد خارج نطاق النظام المُدرَّب عليه، مما يدل على أن CSA يمكن أن تكون خاصية قابلة للنقل بين نماذج مختلفة.

علاوة على ذلك، تبرز أهمية CSA في التطبيقات العملية، حيث يُساهم في تحسين اتخاذ القرارات في الوقت الفعلي، ويوفر إشارات هامة لاختيار بيانات التدريب بشكل مستهدف. هذه الاكتشافات الجديدة تحمل الكثير من الوعد لتحسين أداء نماذج الذكاء الاصطناعي وتعزز من مصداقيتها في معالجة المعلومات.