في عالم الذكاء الاصطناعي المتسارع، تأتي مجموعة بيانات Faithfulness-QA لتكون نقطة تحول في كيفية تدريب نماذج توليد الإجابات المعززة بالاسترجاع (RAG). تعتبر هذه النماذج تحديًا حقيقيًا عند محاولة تحقيق توازن بين المعرفة المستخرجة من الذاكرة الوصفية والسياق المسترجع. فغالبًا ما ينتج عن هذا الخلل عدم موثوقية الإجابات التي يقدمها النموذج.
تتكون مجموعة بيانات Faithfulness-QA من 99,094 عينة تم إنشاؤها عبر تقنية استبدال الكيانات العكسية. انطلقت هذه الفكرة من اختبارين معروفيين في مجال استرجاع الإجابات، وهما SQuAD وTriviaQA. ومن خلال استبدال الكيانات المعروفة بأخرى من بنك منسق يضم 76,953 كيانًا، يتم إنشاء صراعات معرفية مضبوطة بين المعرفة الداخلية وسياق الأسئلة المطروحة.
تضمن عملية الفلترة الدقيقة لمجموعة البيانات جودة عالية، حيث تم التأكد من نجاح 100% عبر أربعة اختبارات تلقائية على عينة عشوائية من 200 نموذج. كما تم إطلاق مجموعة البيانات بالكامل، بالإضافة إلى خوارزمية البناء وبنك الكيانات المصنفة الذي يغطي ثماني فئات من الكيانات.
مجموعة بيانات Faithfulness-QA ليست فقط خطوة نحو تحسين موثوقية نماذج RAG، بل تمثل أيضًا موردًا قيمًا لأهداف الموثوقية المعتمدة على الانتباه، فضلاً عن كونها معيارًا لتقييم سلوك النموذج المتعلق بالسياق. للمزيد من التفاصيل، يمكنكم زيارة [رابط: GitHub](https://github.com/qzhangFDU/faithfulness-qa-dataset). ما رأيكم في هذه الخطوة الجديدة نحو تحسين الذكاء الاصطناعي؟ شاركونا آراءكم في التعليقات!
مجموعة بيانات Faithfulness-QA: خطوة رائدة نحو نماذج RAG أكثر موثوقية!
تم إطلاق مجموعة بيانات Faithfulness-QA التي تتضمن 99,094 عينة، لتعزيز موثوقية نماذج توليد الإجابات المعززة بالاسترجاع (RAG). هدفها هو تحسين أداء هذه النماذج من خلال تعزيز أهمية السياق.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
