في عالم الذكاء الاصطناعي، تتزايد أهمية نماذج اللغات الضخمة (Large Language Models) بشكل متسارع، ومعها تتطور الطرق التي نتعلم بها منها. في هذا السياق، تم تقديم مفهوم جديد يُعرف بـ COSE (التطور الذاتي المنظم بالثقة) والذي يهدف إلى تحسين كيفية تعلم هذه النماذج دون الحاجة إلى إشراف بشري مستمر.

كيف يعمل COSE؟ يعتمد هذا النموذج على فكرة استخدام الثقة الذاتية للنموذج كإشارة خفيفة لتنظيم عملية التعلم. بدلًا من الاعتماد على مدخلات خارجية قد تحد من عمومية النموذج، يقوم COSE بتوظيف الثقة التي يملكها النموذج في تقييم مهامه وحلوله الخاصة. مثلاً، يمكّن التحديثات المعتمدة على الثقة (confidence-weighted PPO updates) وتكرار المهام التي تم إعطاؤها أولوية الثقة (confidence-prioritized replay) النموذج من تحسين أدائه.

عبر تقييمه على 19 معيارًا تم الاحتفاظ بها، وأربعة نماذج أساسية مثل Qwen وLlama (300 مليون - 4 مليار)، أظهر COSE أداءً متميزًا، متفوقًا على النماذج الأساسية وحقق أفضل أداء متوسط في مجالات التفكير العام والرياضيات، مع احتفاظه بالتنافسية في برمجة الشفرات.

هذه الابتكارات قد تعيد تشكيل المشهد المعرفي للذكاء الاصطناعي، مما يعطي الأمل في تقليل الاعتماد على الإشراف البشري وفتح آفاق جديدة للتعلم الذاتي والمرونة.