في عالم الذكاء الاصطناعي، تثير [نماذج [اللغات](/tag/اللغات) الضخمة](/tag/[نماذج](/tag/نماذج)-[اللغات](/tag/اللغات)-الضخمة) ([LLMs](/tag/llms)) اهتمامًا كبيرًا بفضل قدراتها الهائلة في الإنتاج اللغوي والفهم. ولكن كيف تحدد هذه [النماذج](/tag/النماذج) درجة ثقتها في الإجابات التي تقدمها؟ هذا هو السؤال الذي تناوله [بحث](/tag/بحث) [جديد](/tag/جديد) يكشف لنا عن بعض الجوانب المثيرة لهذه [العملية](/tag/العملية).
يشير [البحث](/tag/البحث) إلى أن [نماذج [اللغات](/tag/اللغات) الضخمة](/tag/[نماذج](/tag/نماذج)-[اللغات](/tag/اللغات)-الضخمة) لا تحسب [الثقة اللفظية](/tag/[الثقة](/tag/الثقة)-اللفظية) فقط عند الطلب، بل تقوم بذلك في الوقت الفعلي خلال عملية إنتاج الإجابة، مما يؤدي إلى [تخزين](/tag/تخزين) هذه [البيانات](/tag/البيانات) لاستخدامها لاحقًا. من خلال [دراسة](/tag/دراسة) [نماذج](/tag/نماذج) مثل [Gemma 3](/tag/gemma-3) 27B وQwen 2.5 7B، تم تقديم أدلة تؤكد أن هذه [النماذج](/tag/النماذج) تجمع [المعلومات](/tag/المعلومات) الخاصة بالثقة من الرموز التي تُظهر الإجابات، وتخزنها في الموقع المناسب لاسترجاعها عند الحاجة.
ومن المثير للاهتمام أن استخدام [تقنيات](/tag/تقنيات) مثل [تنشيط](/tag/تنشيط) [التوجيه](/tag/التوجيه) والتجارب المختلفة أظهر أن [تمثيلات](/tag/تمثيلات) [الثقة](/tag/الثقة) تُولد قبل أن تُعرض على المتلقي، مما يعني أنها تقع على مرمى بصر [النماذج](/tag/النماذج) في اللحظة التي تُصاغ فيها الإجابات. هذا يُعَد مثالًا على [تقييم الذات](/tag/[تقييم](/tag/تقييم)-الذات) المُتقدم الذي تقوم به النماذج، وليس مجرد إعادة [بناء](/tag/بناء) بسيطة بعد تلقي الإخراج.
سيساعد هذا الفهم في [تحسين](/tag/تحسين) [دقة](/tag/دقة) [التنبؤات](/tag/التنبؤات) التي تقدمها هذه النماذج، مما يدل على أن [تقييم جودة](/tag/[تقييم](/tag/تقييم)-جودة) الإجابات يتم بشكل أكثر تعقيدًا من مجرد [قياس](/tag/قياس) بساطة [اللغة](/tag/اللغة). فهذه الأمور تمهد الطريق لفهم أعمق لما يُعرف بالميتاقognition لدى [النماذج الضخمة](/tag/[النماذج](/tag/النماذج)-الضخمة).
كيف تحسب نماذج اللغات الضخمة (LLMs) درجة الثقة اللفظية؟
تكشف الأبحاث الجديدة أن نماذج اللغات الضخمة (LLMs) تقوم بحساب درجة الثقة اللفظية بشكل آلي وليس فقط عند الطلب. هذه النتائج تفتح أبوابًا لفهم أعمق لعملية تقييم الجودة في هذه النماذج.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
