في عالم الذكاء الاصطناعي، تثير نماذج اللغات الضخمة (LLMs) اهتمامًا كبيرًا بفضل قدراتها الهائلة في الإنتاج اللغوي والفهم. ولكن كيف تحدد هذه النماذج درجة ثقتها في الإجابات التي تقدمها؟ هذا هو السؤال الذي تناوله بحث جديد يكشف لنا عن بعض الجوانب المثيرة لهذه العملية.
يشير البحث إلى أن نماذج اللغات الضخمة لا تحسب الثقة اللفظية فقط عند الطلب، بل تقوم بذلك في الوقت الفعلي خلال عملية إنتاج الإجابة، مما يؤدي إلى تخزين هذه البيانات لاستخدامها لاحقًا. من خلال دراسة نماذج مثل Gemma 3 27B وQwen 2.5 7B، تم تقديم أدلة تؤكد أن هذه النماذج تجمع المعلومات الخاصة بالثقة من الرموز التي تُظهر الإجابات، وتخزنها في الموقع المناسب لاسترجاعها عند الحاجة.
ومن المثير للاهتمام أن استخدام تقنيات مثل تنشيط التوجيه والتجارب المختلفة أظهر أن تمثيلات الثقة تُولد قبل أن تُعرض على المتلقي، مما يعني أنها تقع على مرمى بصر النماذج في اللحظة التي تُصاغ فيها الإجابات. هذا يُعَد مثالًا على تقييم الذات المُتقدم الذي تقوم به النماذج، وليس مجرد إعادة بناء بسيطة بعد تلقي الإخراج.
سيساعد هذا الفهم في تحسين دقة التنبؤات التي تقدمها هذه النماذج، مما يدل على أن تقييم جودة الإجابات يتم بشكل أكثر تعقيدًا من مجرد قياس بساطة اللغة. فهذه الأمور تمهد الطريق لفهم أعمق لما يُعرف بالميتاقognition لدى النماذج الضخمة.
كيف تحسب نماذج اللغات الضخمة (LLMs) درجة الثقة اللفظية؟
تكشف الأبحاث الجديدة أن نماذج اللغات الضخمة (LLMs) تقوم بحساب درجة الثقة اللفظية بشكل آلي وليس فقط عند الطلب. هذه النتائج تفتح أبوابًا لفهم أعمق لعملية تقييم الجودة في هذه النماذج.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
