في عالم المعلومات المتزايد، يبذل الباحثون جهدًا كبيرًا لضمان استناد المعلومات إلى أدلة موثوقة. قدمت دراسة جديدة نهجًا مبتكرًا يتمثل في "التحقق الهجين من الحقائق"، الذي يجمع بين قوة حديثة من نماذج اللغة الضخمة (Large Language Models) وخرائط المعرفة (Knowledge Graphs) لتقديم نتائج أكثر دقة وموثوقية.
تمتاز نماذج اللغة الضخمة بقدرتها على إنتاج نصوص طبيعية وفعالة. لكن غالبًا ما تفتقر تلك النماذج إلى المراجع الموثوقة أو المعلومات المؤكدة. بينما تسهم خرائط المعرفة في تقديم أدلة دقيقة، تعاني أحيانًا من محدودية في الهدف أو سرعة الاستجابة.
تقدم الطريقة الهجينة ثلاثة خطوات مستقلة:
1) **استرجاع خرائط المعرفة (KG Retrieval)**، التي تتيح الوصول السريع إلى بيانات موثوقة عبر DBpedia.
2) **تصنيف باستخدام نماذج اللغة (LM-based classification)**، مسترشدًا بإرشادات محددة لكل مهمة، مما ينتج عنه مخرجات تعتمد على منطق داخلي قائم على القواعد.
3) **عميل البحث عبر الويب (Web Search Agent)**، الذي يتم تفعيله فقط عند عدم كفاية تغطية خرائط المعرفة.
لقد حقق نظامنا معدل F1 قدره 0.93 في معيار FEVER في تقسيم المدعوم/المرفوض دون الحاجة إلى ضبط محدد للمهمة. ومع معالجة حالات "لا توجد معلومات كافية"، أظهرت دراستنا إعادة التصنيف المستهدفة أننا اكتشفنا أدلة صالحة لادعاءات تم تصنيفها في الأصل على أنها "لا توجد معلومات كافية"، وهو ما أكدته كل من المُصنفين الخبراء ومراجعي نماذج اللغة.
بهذا، نقدم نظام تحقق من الحقائق مفتوح المصدر وقابل للتوسع، مع استراتيجيات بديلة وتعميم عبر مجموعات البيانات المختلفة. هل تعتقد أن هذا النظام الجديد سيغير مجرى التحقق من المعلومات؟ شاركنا رأيك في التعليقات.
تحقيق الحقائق الهجين: دمج النماذج اللغوية الضخمة وخرائط المعرفة لزيادة دقة التحقق من المعلومات!
تمكن أسلوب التحقق الهجين من الدمج بين نماذج اللغة الضخمة وخرائط المعرفة لتحسين موثوقية التحقق من المعلومات. يعد هذا نهجًا مبتكرًا يوفر أدلة دقيقة وفعالة.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
