في عالم رؤية الكمبيوتر المتطور، تعتبر عملية الربط بين الكائنات متعددة الرؤى (Multi-view Object Association) واحدة من التحديات الأساسية التي تدعم العديد من مهام الإدراك باستخدام عدة كاميرات. وعلى الرغم من أن هذه المهمة مصممة بشكل طبيعي كمشكلة مطابقة مقيّدة لجوانب معينة، إلا أن الدراسات الحديثة تعتمد بشكل كبير على معايير الترتيب الثنائي مثل متوسط الدقة (Average Precision - AP) ونسبة الإيجابيات الخاطئة عند مستوى 95% (FPR-95) لتقييم النماذج.

تسلط هذه الدراسة الضوء على تعارض جوهري بين هذه المعايير وهدف التخصيص الفعلي. من الناحية النظرية، قمنا بإثبات أن AP وFPR-95 يمكن أن تكون غير دقيقة حتى عندما يكون التخصيص صحيحًا بالفعل. علاوة على ذلك، يمكن للتطبيع القائم على خوارزمية سينكهورن (Sinkhorn) أن يجعل هذه المعايير مثالية. في المقابل، قد يؤدي تحسين التقييم الثنائي فقط إلى تخصيصات غير صحيحة.

للتحقق من هذا التعارض، استخدمنا عمليات ما بعد المعالجة القائم على سينكهورن كاختبار إجهاد محدد. وأظهرنا أن تحسين عدد قليل من معلمات ما بعد المعالجة يمكن أن يعزز بشكل كبير من مقاييس AP وFPR-95 دون تحقيق تحسينات متساوية في مقياس التخصيص مثل دقة المطابقة (Accuracy - ACC) ودرجة تعميم التخصيص عبر الفقرات (IPAA). هذا يثير تساؤلات حول موثوقية المعايير الشائعة المستخدمة في تقييم نماذج الربط، ويشير إلى الحاجة إلى تطوير معايير تقييم جديدة تتماشى مع الأهداف الفعلية لهذه التقنيات.