تُعتبر نماذج اللغات الضخمة (Large Language Models) جزءًا أساسيًا من الثورة الرقمية الحالية، حيث تبرز قدراتها الرائعة في معالجة المهام المتنوعة. ومع ذلك، يعاني العديد من هذه النماذج من مشكلة كبيرة تتعلق بتوليد إجابات تبدو واقعية ولكنها قد تكون خاطئة من الناحية الواقعية. يعد غياب تقديرات عدم اليقين (uncertainty estimates) أحد أسباب صعوبة تقييم موثوقية النتائج التي تقدمها هذه النماذج.

تستخدم الطرق الحالية لتقدير عدم اليقين في العادة إشارات غير مباشرة، مثل الانتروبيا، التي يمكن أن تكون صعبة التفسير ولا تستفيد بالكامل من قدرة النموذج على تقييم عدم يقينه. لذلك، يُقترح أسلوب بسيط ولكنه فعّال لتقدير عدم اليقين، يقوم على تجميع الاستجابات المولدة في مجموعات ذات معاني مختلفة.

تتمثل الفكرة في تحويل هذه المجموعات إلى خيارات إجابة ضمن سؤال متعدد الخيارات، واستخدام الاحتمالية التي يخصصها النموذج لكل خيار كمقياس للثقة. تم اختبار هذه الطريقة الجديدة على مجموعة من النماذج والبيانات، وأظهرت النتائج تفوقها المستمر على الأساليب التقليدية.

المثير للاهتمام هو أن هذه الطريقة تحقق أداءً تنافسياً مع نموذجين إضافيين فقط، مما يدل على فعاليتها وكفاءتها. في ضوء هذه التطورات، كيف يمكن أن تغير هذه التقنيات من استخدامنا للذكاء الاصطناعي في المستقبل؟