في عالم الذكاء الاصطناعي، تُعتبر نماذج اللغة الكبيرة (Large Language Models) أداة قوية، لكنها تحمل في طياتها تحديات كبيرة مثل ميولها إلى 'الهلاوس' أو إصدار معلومات غير دقيقة. هنا يأتي دور تقنيات قياس عدم اليقين (Uncertainty Quantification - UQ)، التي تهدف إلى تعزيز موثوقية هذه النماذج.

تُظهر الأبحاث الجديدة، التي تم نشرها في arXiv، تقدمًا ملحوظًا في هذا المجال من خلال الطريقة الجديدة المسماة SemGrad. هذه التقنية ليست فقط جديدة، بل أيضًا فعّالة، حيث تخلت عن الحاجة إلى العينات، مما يقلل من التكاليف الحسابية المرتبطة بالأساليب التقليدية.

تعتمد SemGrad على تحليل التوجيهات في الفضاء الدلالي، عوضًا عن الفضاء المعلمي كما هو الحال في الطرق السابقة. الفكرة الأساسية هنا هي أن نموذج اللغة الموثوق يجب أن يحافظ على توزيع مستقر للمخرجات حتى في ظل تغييرات بسيطة في المدخلات الدلالية. ولتقييم هذا الاستقرار، قدّم الباحثون مقياس حفظ الدلالة (Semantic Preservation Score - SPS) لقياس مدى فعالية التضمينات في التقاط المعاني السليمة.

علاوة على ذلك، تم تقديم تقنية جديدة أخرى تُدعى HybridGrad، التي تجمع بين مزايا SemGrad والتوجيهات في الفضاء المعلمي، مما يُسهم في تحسين تقديرات عدم اليقين بكفاءة وفعالية.

أظهرت التجارب أن كلا الطريقتين، SemGrad وHybridGrad، تقدمان تقديرات دقيقة لعدم اليقين، متفوقتين على الأساليب الحالية في ظل بيئات متعددة الاستجابات الصحيحة.

هذا الابتكار يفتح آفاقًا جديدة لتحسين موثوقية نماذج اللغة الكبيرة، مما يُعد خطوة كبيرة نحو تحقيق مستويات أعلى من الدقة والثقة في تطبيقات الذكاء الاصطناعي.