في عالم تعلم الآلة، يُعتبر مصطلح 'الحقائق الأرضية' (Ground Truth) هو التصنيفات المفترض أنها صحيحة والتي تُستخدم في تدريب وتقييم النماذج. لكن هل تساءلت يومًا عن أساس هذا المفهوم؟ يبدو أن الفهم التقليدي للحقائق الأرضية يستند إلى مغالطة إيجابية تُعتبر فيها الخلافات البشرية ضوضاء فنية، بدلًا من أن تُعتبر مؤشرات حيوية في السياقات الاجتماعية-التقنية.

في مراجعة شاملة للأبحاث المنشورة بين عامي 2020 و2025 عبر سبعة منبرين مرموقين، مثل ACL وAIES وCHI وCSCW وEAAMO وFAccT وNeurIPS، تم التحقيق في الممارسات المتعلقة بتنسيق البيانات التي تسهم في ما يُعرف بـ 'فخ التوافق' (Consensus Trap). من خلال التحليل الموضوعي لـ346 ورقة بحثية، اكتشفنا أن الفشل النظامي في وضوح النقاط المحورية، بالإضافة إلى التحول الأخير نحو نماذج تعتمد على التحقق البشري، خاصةً الاعتماد على التنسيقات المُعَادة من قبل النموذج (Model-Mediated Annotations)، أدت إلى انغماس عميق في الانحياز وبالتالي إخراج أصوات البشر من العملية.

علاوة على ذلك، يظهر بحثنا كيف تفرض الهيمنة الجغرافية المعايير الغربية كمعايير عالمية، مما يعزز التوافق من خلال تنسيق بيانات العاملين الهشين الذين يفضلون الالتزام بطلبات المُتكالين الاقتصادية بدلاً من التعبير عن آرائهم بصدق. في نقدنا لمغالطة 'حساس ضوضاء' (Noisy Sensor)، حيث يخطئ النماذج الإحصائية في اعتبار التعددية كخطأ، ندعو إلى استعادة الخلاف كإشارة ذات دقة عالية ضرورية لبناء نماذج تتمتع بالكفاءة الثقافية.

للتعامل مع هذه التوترات النظامية، نقترح خارطة طريق لبنية تحتية متعددة الثقافات لتنسيق البيانات، تُركّز على تحويل الهدف من اكتشاف إجابة واحدة 'صحيحة' إلى خريطة تنوع التجارب البشرية.