في عالم [الذكاء الاصطناعي](/tag/الذكاء-الاصطناعي) الذي يشهد تزايداً مستمراً، برزت [أنظمة](/tag/أنظمة) [التوليد](/tag/التوليد) المدعوم بالاسترجاع ([Retrieval-Augmented Generation](/tag/retrieval-augmented-generation) - [RAG](/tag/rag)) كأحد [النماذج](/tag/النماذج) الرائدة في [تطوير](/tag/تطوير) [نماذج [اللغات](/tag/اللغات) الكبيرة](/tag/[نماذج](/tag/نماذج)-[اللغات](/tag/اللغات)-الكبيرة) (Large Language [Models](/tag/models) - [LLMs](/tag/llms)). ومع ذلك، لا تزال مسألة [موثوقية](/tag/موثوقية) هذه الأنظمة بحاجة إلى مزيد من [البحث](/tag/البحث) والدراسة.

تعمل [أنظمة RAG](/tag/[أنظمة](/tag/أنظمة)-rag) على تعزيز [موثوقية](/tag/موثوقية) [نماذج [اللغات](/tag/اللغات) الكبيرة](/tag/[نماذج](/tag/نماذج)-[اللغات](/tag/اللغات)-الكبيرة) من خلال اعتمادها على [معرفة](/tag/معرفة) خارجية محدثة، مما يقلل من حالات "[الهلاوس](/tag/الهلاوس)" أو الردود غير الصحيحة. لكن، لا تزال التحديات قائمة، حيث إن اعتماد هذه الأنظمة على [استرجاع](/tag/استرجاع) [بيانات](/tag/بيانات) غير موثوقة أو استخدام [معرفة](/tag/معرفة) بطريقة غير صحيحة يمكن أن يؤدي إلى مخرجات غير مرضية.

للإجابة على هذه التحديات، نقدم إطار [عمل](/tag/عمل) موحد يُسمى "Trust-[RAG](/tag/rag) Compass"، الذي يسعى لتقييم [موثوقية](/tag/موثوقية) [أنظمة RAG](/tag/[أنظمة](/tag/أنظمة)-rag) [عبر](/tag/عبر) ستة أبعاد رئيسية: [الدقة](/tag/الدقة) (factuality)، القوة (robustness)، [العدالة](/tag/العدالة) (fairness)، [الشفافية](/tag/الشفافية) (transparency)، [المساءلة](/tag/المساءلة) (accountability)، والخصوصية (privacy). من خلال هذا الإطار، نقدم مراجعة شاملة للمصادر الأدبية ذات الصلة.

علاوة على ذلك، قدمنا [معيار تقييم](/tag/معيار-[تقييم](/tag/تقييم)) يُعرف باسم "TRC Bench"، الذي يتعلق بالأبعاد الستة المذكورة، حيث أجرينا [تقييمات](/tag/تقييمات) شاملة لمجموعة متنوعة من النماذج، سواء كانت خاصة أو مفتوحة المصدر. تكشف نتائجنا الفجوات في [الأداء](/tag/الأداء) بين أنواع مختلفة من [نماذج [اللغات](/tag/اللغات) الكبيرة](/tag/[نماذج](/tag/نماذج)-[اللغات](/tag/اللغات)-الكبيرة) [عبر](/tag/عبر) أبعاد [الثقة](/tag/الثقة) المختلفة.

في الختام، ننظر إلى التحديات الأساسية والاتجاهات الواعدة للبحث المستقبلي بناءً على النتائج التي توصلنا إليها. من خلال هذا العمل، نهدف إلى وضع أساس منظم لمزيد من التحقيقات وإرشادات عملية لتطوير [أنظمة RAG](/tag/[أنظمة](/tag/أنظمة)-rag) موثوقة في السيناريوهات الحقيقية.