في عالم [الذكاء الاصطناعي](/tag/الذكاء-الاصطناعي) الذي يشهد تزايداً مستمراً، برزت [أنظمة](/tag/أنظمة) [التوليد](/tag/التوليد) المدعوم بالاسترجاع ([Retrieval-Augmented Generation](/tag/retrieval-augmented-generation) - [RAG](/tag/rag)) كأحد [النماذج](/tag/النماذج) الرائدة في [تطوير](/tag/تطوير) [نماذج [اللغات](/tag/اللغات) الكبيرة](/tag/[نماذج](/tag/نماذج)-[اللغات](/tag/اللغات)-الكبيرة) (Large Language [Models](/tag/models) - [LLMs](/tag/llms)). ومع ذلك، لا تزال مسألة [موثوقية](/tag/موثوقية) هذه الأنظمة بحاجة إلى مزيد من [البحث](/tag/البحث) والدراسة.
تعمل [أنظمة RAG](/tag/[أنظمة](/tag/أنظمة)-rag) على تعزيز [موثوقية](/tag/موثوقية) [نماذج [اللغات](/tag/اللغات) الكبيرة](/tag/[نماذج](/tag/نماذج)-[اللغات](/tag/اللغات)-الكبيرة) من خلال اعتمادها على [معرفة](/tag/معرفة) خارجية محدثة، مما يقلل من حالات "[الهلاوس](/tag/الهلاوس)" أو الردود غير الصحيحة. لكن، لا تزال التحديات قائمة، حيث إن اعتماد هذه الأنظمة على [استرجاع](/tag/استرجاع) [بيانات](/tag/بيانات) غير موثوقة أو استخدام [معرفة](/tag/معرفة) بطريقة غير صحيحة يمكن أن يؤدي إلى مخرجات غير مرضية.
للإجابة على هذه التحديات، نقدم إطار [عمل](/tag/عمل) موحد يُسمى "Trust-[RAG](/tag/rag) Compass"، الذي يسعى لتقييم [موثوقية](/tag/موثوقية) [أنظمة RAG](/tag/[أنظمة](/tag/أنظمة)-rag) [عبر](/tag/عبر) ستة أبعاد رئيسية: [الدقة](/tag/الدقة) (factuality)، القوة (robustness)، [العدالة](/tag/العدالة) (fairness)، [الشفافية](/tag/الشفافية) (transparency)، [المساءلة](/tag/المساءلة) (accountability)، والخصوصية (privacy). من خلال هذا الإطار، نقدم مراجعة شاملة للمصادر الأدبية ذات الصلة.
علاوة على ذلك، قدمنا [معيار تقييم](/tag/معيار-[تقييم](/tag/تقييم)) يُعرف باسم "TRC Bench"، الذي يتعلق بالأبعاد الستة المذكورة، حيث أجرينا [تقييمات](/tag/تقييمات) شاملة لمجموعة متنوعة من النماذج، سواء كانت خاصة أو مفتوحة المصدر. تكشف نتائجنا الفجوات في [الأداء](/tag/الأداء) بين أنواع مختلفة من [نماذج [اللغات](/tag/اللغات) الكبيرة](/tag/[نماذج](/tag/نماذج)-[اللغات](/tag/اللغات)-الكبيرة) [عبر](/tag/عبر) أبعاد [الثقة](/tag/الثقة) المختلفة.
في الختام، ننظر إلى التحديات الأساسية والاتجاهات الواعدة للبحث المستقبلي بناءً على النتائج التي توصلنا إليها. من خلال هذا العمل، نهدف إلى وضع أساس منظم لمزيد من التحقيقات وإرشادات عملية لتطوير [أنظمة RAG](/tag/[أنظمة](/tag/أنظمة)-rag) موثوقة في السيناريوهات الحقيقية.
نظرة متعمقة على موثوقية أنظمة التوليد المدعوم بالاسترجاع: كيف يمكن تحسين الذكاء الاصطناعي؟
يستعرض هذا المقال مفهوم موثوقية أنظمة التوليد المدعوم بالاسترجاع (RAG) ويقترح إطاراً جديداً لتقييم هذه الأنظمة. من خلال تحليل ستة أبعاد رئيسية، يكشف المقال عن الثغرات الموجودة والتحديات المستقبلية.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
