تعتبر [نماذج [اللغات](/tag/اللغات) الضخمة](/tag/[نماذج](/tag/نماذج)-[اللغات](/tag/اللغات)-الضخمة) (Large Language [Models](/tag/models)) من أكثر التقنيات تقدمًا في مجال الذكاء الاصطناعي، لكنها تواجه [تحديات](/tag/تحديات) عدة عندما يتعلق الأمر بالإجابة عن الأسئلة. إحدى القضايا المهمة هي قدرتها على [رفض](/tag/رفض) الأسئلة التي لا تمتلك [المعرفة](/tag/المعرفة) الكافية للإجابة عنها، وهو ما يُعرف بالرفض المعرفي (knowledge-aware refusal).
وفي هذا السياق، تم تقديم مقياس [جديد](/tag/جديد) يُعرف بمؤشر الرفض (Refusal Index - RI)، والذي يقيس بدقة كيفية قدرة [نماذج [اللغات](/tag/اللغات) الضخمة](/tag/[نماذج](/tag/نماذج)-[اللغات](/tag/اللغات)-الضخمة) على [رفض](/tag/رفض) الأسئلة التي لا تعرفها. يُعرَّف RI على أنه ارتباط رتب سبيرمان (Spearman's rank correlation) بين [احتمالية](/tag/احتمالية) الرفض واحتمالية الخطأ.
ليس ذلك فحسب، بل تمثل طريقة [التقييم](/tag/التقييم) الجديدة التي تعتمد على معالجة ثنائية خفيفة الوزن. إذ تتطلب فقط [قياس](/tag/قياس) معدلات الرفض [عبر](/tag/عبر) تجربتين قياسيتين. وقد أظهرت [التجارب](/tag/التجارب) الواسعة التي شملت 16 نموذجًا و5 [مجموعات بيانات](/tag/مجموعات-[بيانات](/tag/بيانات)) أن RI يوفر تقييمًا دقيقًا لقدرة النموذج على [الرفض المعرفي](/tag/الرفض-المعرفي).
تتمثل أهمية RI في أنه يعطي نظرة ثاقبة حول [سلوك](/tag/سلوك) الرفض لنماذج [اللغات](/tag/اللغات) الضخمة. فعلى الرغم من [تحقيق](/tag/تحقيق) هذه [النماذج](/tag/النماذج) لدقة عالية في المهام الواقعية، إلا أن سلوكها في الرفض قد يكون غير موثوق وهش. باختصار، إن [فهم](/tag/فهم) كيفية [تفاعل النموذج](/tag/[تفاعل](/tag/تفاعل)-النموذج) مع الأسئلة المجهولة قد يعزز من [موثوقية](/tag/موثوقية) [المعلومات](/tag/المعلومات) المقدمة ويزيد من [ثقة](/tag/ثقة) المستخدمين في [أدوات](/tag/أدوات) [الذكاء الاصطناعي](/tag/الذكاء-الاصطناعي).
ما رأيكم في هذه القدرات الجديدة لنماذج [اللغات](/tag/اللغات) الضخمة؟ شاركونا في [التعليقات](/tag/التعليقات).
هل يمكن لنماذج اللغات الضخمة رفض الإجابة عن الأسئلة التي لا تعرفها؟ اكتشفوا قدرة الرفض المعرفي!
تناقش الأبحاث الأخيرة قدرة نماذج اللغات الضخمة على رفض الأسئلة التي تخرج عن نطاق معرفتها، مع تقديم مقياس جديد لقياس هذه القدرة. تعرفوا على مقياس Refusal Index وكيف يعزز دقة المعلومات.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
