في عالم المعلومات الغني بصرياً، تبرز أهمية استرداد المعلومات التي تدمج النصوص مع الرسوم البيانية، والجداول، والمخططات. يهدف تحدي "استرداد الوثائق متعددة الوسائط" (Multimodal Document Retrieval Challenge) الذي يُعقد في ورشة العمل EReL@MIR 2025، المشمولة في مؤتمر الويب، إلى استكشاف الطرق التي يمكن من خلالها تحسين استرداد المعلومات من الوثائق الطويلة. يتطلب التحدي من المشاركين تطوير نظام استرداد واحد يمكنه معالجة نوعين متكاملين من الأنظمة: استرداد صفحات الوثائق المغلقة من استعلام نصي (MMDocIR) واسترداد النصوص من ويكي بيديا استنادًا إلى صورة أو مزيج من الصورة والنص (M2KR).
استقطب هذا التحدي 455 مشاركًا مع 586 تقديمًا من 22 فريقًا، حيث تم تصنيف الأنظمة بناءً على معدل الاسترجاع المتوسط. تركز التقارير على تصميم التحدي، والمجموعات البيانية، وبروتوكول التقييم، بالإضافة إلى التحليل النهائي لنتائج الفرق الثلاثة الفائزة. وقد اعتمدت الأنظمة الثلاثة الفائزة على نماذج LLMS متعددة الوسائط من عائلة Qwen2-VL، حيث تميزت بالقدرة على التفوق من خلال الأساليب المختلفة، منها الفرق المعززة بالتدريب، الفيوجن المتعدد المسارات، أو التفاعل المتأخر دون تدريب.
إن التطورات في هذا المجال توفر رؤى جديدة حول كيفية تحسين استرداد المعلومات في البيئات المتعددة الوسائط، مما يتيح لنا التفكير مليًا في مستقبل البحث والمعلومات المتعددة الوسائط.
تحدي استرداد الوثائق متعددة الوسائط EReL@MIR 2025: الابتكارات تهيمن على المنافسة!
يتناول تحدي EReL@MIR 2025 لاسترداد الوثائق متعددة الوسائط المنافسة في استرداد المعلومات، حيث أثرى 22 فريقًا ب585 تقديمًا. إن النظام الفائز يعتمد على نماذج LLMS متعددة الوسائط لتقديم أداء مذهل.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
