في عصر المعلومات، أصبح تصنيف الوثائق (Document Classification) واحداً من المجالات الحيوية التي تعتمد بشكل متزايد على دمج مصادر بيانات متعددة (Multimodal) وأشكال تمثيل مختلفة (Multiview). رغم الفوائد المترتبة على هذه العملية، إلا أن المجال يعاني من نقص في الإطار الموحد، والتحليل الكمي لمدى فعاليتها، وكذلك التوجيه الواضح للممارسين.

هذه المراجعة المنهجية جاء لتحل هذه الفجوات من خلال تحليل 139 دراسة أساسية، حيث تم تقديم إطار عمل رسمي لتنظيم هذا المجال. تبرز نتائج التحليل النوعي الاتجاهات الرئيسية، بينما يتم إجراء تحليل ميتا للأثر العشوائي ليكون الأول من نوعه في هذا المجال بدلاً من الاستناد إلى بساطة الخوارزميات.

تكشف نتائج التحليل أن دمج المعلومات المتعددة يؤدي إلى تحسين ملحوظ في الدقة بمعدل متوسط يبلغ +5.28 نقاط مئوية (p=0.0016). بينما كانت تأثيرات الدقة للدمج المتعدد الرؤى ثابتة ولكن بتغييرات متواضعة، حيث حقق تحسنًا قدره +4.67% بالنسبة للدقة و+3.08% لدرجة F1، مما يسجل جميعها قيم دالة إحصائياً (p<0.05).

ومع ذلك، يكشف التحليل النوعي عن تحديات كبيرة في إمكانية إعادة إنتاج النتائج بسبب عدم استخدام الدراسات الإحصاء لتحقق من النتائج، حيث لم تتجاوز نسبة 11.8% في الدراسات متعددة الوسائط و23.3% في الدراسات متعددة الرؤى. يركز الاستنتاج على أن نجاح دمج المعلومات يعتمد ليس فقط على تعقيد الخوارزمية، بل أيضاً على التوافق الاستراتيجي لطريقة الدمج مع سياق المهمة، والتزام أكبر بمزيد من التحقق الدقيق.