تعتبر [نماذج [اللغات](/tag/اللغات) الضخمة](/tag/[نماذج](/tag/نماذج)-[اللغات](/tag/اللغات)-الضخمة) (Large Language [Models](/tag/models)) من أكثر التقنيات تقدمًا في مجال الذكاء الاصطناعي، لكنها تواجه [تحديات](/tag/تحديات) عدة عندما يتعلق الأمر بالإجابة عن الأسئلة. إحدى القضايا المهمة هي قدرتها على [رفض](/tag/رفض) الأسئلة التي لا تمتلك [المعرفة](/tag/المعرفة) الكافية للإجابة عنها، وهو ما يُعرف بالرفض المعرفي (knowledge-aware refusal).

وفي هذا السياق، تم تقديم مقياس [جديد](/tag/جديد) يُعرف بمؤشر الرفض (Refusal Index - RI)، والذي يقيس بدقة كيفية قدرة [نماذج [اللغات](/tag/اللغات) الضخمة](/tag/[نماذج](/tag/نماذج)-[اللغات](/tag/اللغات)-الضخمة) على [رفض](/tag/رفض) الأسئلة التي لا تعرفها. يُعرَّف RI على أنه ارتباط رتب سبيرمان (Spearman's rank correlation) بين [احتمالية](/tag/احتمالية) الرفض واحتمالية الخطأ.

ليس ذلك فحسب، بل تمثل طريقة [التقييم](/tag/التقييم) الجديدة التي تعتمد على معالجة ثنائية خفيفة الوزن. إذ تتطلب فقط [قياس](/tag/قياس) معدلات الرفض [عبر](/tag/عبر) تجربتين قياسيتين. وقد أظهرت [التجارب](/tag/التجارب) الواسعة التي شملت 16 نموذجًا و5 [مجموعات بيانات](/tag/مجموعات-[بيانات](/tag/بيانات)) أن RI يوفر تقييمًا دقيقًا لقدرة النموذج على [الرفض المعرفي](/tag/الرفض-المعرفي).

تتمثل أهمية RI في أنه يعطي نظرة ثاقبة حول [سلوك](/tag/سلوك) الرفض لنماذج [اللغات](/tag/اللغات) الضخمة. فعلى الرغم من [تحقيق](/tag/تحقيق) هذه [النماذج](/tag/النماذج) لدقة عالية في المهام الواقعية، إلا أن سلوكها في الرفض قد يكون غير موثوق وهش. باختصار، إن [فهم](/tag/فهم) كيفية [تفاعل النموذج](/tag/[تفاعل](/tag/تفاعل)-النموذج) مع الأسئلة المجهولة قد يعزز من [موثوقية](/tag/موثوقية) [المعلومات](/tag/المعلومات) المقدمة ويزيد من [ثقة](/tag/ثقة) المستخدمين في [أدوات](/tag/أدوات) [الذكاء الاصطناعي](/tag/الذكاء-الاصطناعي).

ما رأيكم في هذه القدرات الجديدة لنماذج [اللغات](/tag/اللغات) الضخمة؟ شاركونا في [التعليقات](/tag/التعليقات).