في عالم الذكاء الاصطناعي، تثير نماذج اللغات الضخمة (LLMs) اهتمامًا كبيرًا بفضل قدراتها الهائلة في الإنتاج اللغوي والفهم. ولكن كيف تحدد هذه النماذج درجة ثقتها في الإجابات التي تقدمها؟ هذا هو السؤال الذي تناوله بحث جديد يكشف لنا عن بعض الجوانب المثيرة لهذه العملية.

يشير البحث إلى أن نماذج اللغات الضخمة لا تحسب الثقة اللفظية فقط عند الطلب، بل تقوم بذلك في الوقت الفعلي خلال عملية إنتاج الإجابة، مما يؤدي إلى تخزين هذه البيانات لاستخدامها لاحقًا. من خلال دراسة نماذج مثل Gemma 3 27B وQwen 2.5 7B، تم تقديم أدلة تؤكد أن هذه النماذج تجمع المعلومات الخاصة بالثقة من الرموز التي تُظهر الإجابات، وتخزنها في الموقع المناسب لاسترجاعها عند الحاجة.

ومن المثير للاهتمام أن استخدام تقنيات مثل تنشيط التوجيه والتجارب المختلفة أظهر أن تمثيلات الثقة تُولد قبل أن تُعرض على المتلقي، مما يعني أنها تقع على مرمى بصر النماذج في اللحظة التي تُصاغ فيها الإجابات. هذا يُعَد مثالًا على تقييم الذات المُتقدم الذي تقوم به النماذج، وليس مجرد إعادة بناء بسيطة بعد تلقي الإخراج.

سيساعد هذا الفهم في تحسين دقة التنبؤات التي تقدمها هذه النماذج، مما يدل على أن تقييم جودة الإجابات يتم بشكل أكثر تعقيدًا من مجرد قياس بساطة اللغة. فهذه الأمور تمهد الطريق لفهم أعمق لما يُعرف بالميتاقognition لدى النماذج الضخمة.