في عالم الذكاء الاصطناعي المتقدم، تلعب نماذج اللغات الضخمة (Large Language Models) دورًا حيويًا، لكن الثقة في أدائها تتأثر غالبًا بعوامل عدم اليقين. من هنا تأتي أهمية قياس عدم اليقين (Uncertainty Quantification) كخطوة رئيسية لضمان نشر موثوق لهذه التقنيات. تُظهر الطرق الحالية التي تعتمد على إشارات على مستوى الرموز محدوديتها، حيث تفتقر إلى استغلال الهيكل الهندسي للحالات الخفية (Hidden States).

في دراسة جديدة تم تقديمها على موقع arXiv، يطرح الباحثون فكرة جديدة لقياس عدم اليقين من خلال التركيز على التعقيد الهندسي لمصفوفات الحالات الخفية كمعيار لعدم اليقين العالمي. وفي الوقت نفسه، يتم التعامل مع تقدير عدم اليقين على مستوى الرموز كمقياس محلي. يوضح الباحثون أن الانتروبيا الهندسية للحالات الخفية (Global Entropy) والانتروبيا على مستوى الرموز (Local Entropy) تعتبر قريبة إحصائياً من عدم التداخل، مما يسمح لها بالتقاط أنماط فشل مختلفة.

أحد النتائج المهمة لهذه الدراسة هو اكتشاف نمط الفشل "الثقة العالية ولكن الخطأ" الذي تغفله الإشارات المحلية بشكل دوري. وبناءً على ذلك، يقترح الباحثون نظامًا جديدًا يسمى (Global-Local Uncertainty) GLU، وهو معيار غير مشرف يمكنه دمج هذين النوعين من القياسات عبر بوابة مضاعفة. أظهرت النتائج أن GLU يحقق أداءً متفوقًا على جميع المعايير غير المشرفة الأخرى، مع التوفير في عملية التنفيذ، حيث يتطلب فقط مرورًا واحدًا إلى الأمام.

مع هذه الابتكارات، يظهر الأمل في تحسين دقة نماذج اللغات الضخمة وزيادة موثوقيتها، مما يمكن من استخدامها بشكل أوسع في التطبيقات الحساسة التي تتطلب ثقة عالية. هل ترغب في معرفة المزيد عن كيفية تأثير هذه التحقيقات على مستقبل الذكاء الاصطناعي؟ شاركونا في التعليقات.