في عالم متسارع نحو الذكاء الاصطناعي، تتنافس نماذج اللغات الكبيرة (LLMs) لإيجاد توازن بين الكفاءة الحسابية، مثل عدد المعلمات، وجودة المخرجات، خصوصًا عند العمل على أجهزة ذات موارد محدودة مثل الهواتف المحمولة وأجهزة الكمبيوتر المحمولة. وللتغلب على هذه التحديات، تأتي فكرة مبتكرة تتلخص في استفادة النماذج من تجربة الإنسان. حيث يُمكن للنماذج طلب المساعدة عندما تدرك عدم قدرتها على حل مشكلة بمفردها.

تتناول دراسة جديدة استخدام أساليب مثل Predict-Answer/Act (PA) وReason-Predict-Reason-Answer/Act (RPRA)، حيث تقوم النماذج بالتنبؤ كيف سيقوم قاضي LLM بتقييم مخرجاتها قبل الرد. اختبرت هذه الدراسة ثلاثة نهج: التنبوء بدون أمثلة سابقة (zero-shot prediction)، التنبؤ باستخدام بطاقة تقرير ضمنية، والتدريب تحت الإشراف.

تُظهر النتائج أن النماذج الأكبر، وخاصة النماذج القادرة على التفكير، تؤدي بشكل جيد عند التنبؤ بقضاة LLM في حالة عدم استخدام أمثلة سابقة، بينما يمكن للنماذج الصغيرة التنبؤ بدقة بعد تدريبها أو تزويدها ببطاقة تقرير ضمنية. وبالتالي، يمكن أن تُحسن كلا الطريقتين دقة التنبؤ للنماذج الأصغر بشكل كبير، حيث تحقق بطاقة التقرير وتحسينات التدريب تحسينات متوسطة تصل إلى 55% و52% عبر مجموعات البيانات على التوالي.

تشير هذه النتائج إلى أن النماذج يمكن أن تتعلم كيفية تقييم حدود أدائها، مما يمهد الطريق نحو أنظمة ذكاء اصطناعي أكثر كفاءة ووعيًا بذاتها. في ظل هذا التطور المذهل، كيف ترى مستقبل الذكاء الاصطناعي؟ شاركونا آراءكم في التعليقات!