في ظل التطورات المستمرة في مجال معالجة اللغة الطبيعية (NLP)، أصبحت فكرة تنوع التسمية البشرية (Human Label Variation - HLV) ذات أهمية متزايدة. لسنوات، اعتُبر HLV نوعًا من الضجيج يجب التخلص منه، إلا أن الأبحاث الحديثة تؤكد على ضرورة إعادة تصور هذا التنوع كإشارة تدعم تحسين متانة النماذج.

تتزايد أهمية HLV نتيجة ظهور نماذج اللغة الكبيرة (Large Language Models - LLMs) وتطبيقات التدريب بعد المرحلة الأولية مثل التوافق المدعوم بالتعليقات البشرية. حيث يُظهر HLV اختلاف وجهات نظر البشر، إضافة إلى بأنه يعكس تنوع الآراء بدلاً من كونه مجرد أخطاء في التسمية.

ومع ذلك، تواجه قواعد البيانات الحالية المتعلقة بتعلم التفضيلات تحديًا كبيرًا، حيث يتم دمج العديد من التوصيفات في تسمية واحدة، مما يؤدي إلى تقليص التعددية الحقيقية إلى توافق مصطنع. لذا، من الضروري الحفاظ على HLV ليس فقط للتوافق التعددي، بل أيضًا من أجل تقييم الأمان الاجتماعي والتقني، حيث يجب أن يتم تقييم سلوك النماذج في سياق التفاعل البشري والمجتمع.

تجد هذه الورقة البحثية أن الحفاظ على HLV كرمز للتعددية البشرية يجب أن يعتبر قيمة ذاتية (Selbstzweck) في حد ذاته. كما نستعرض القيود الموجودة في قواعد البيانات الخاصة بالتفضيلات ونقترح استراتيجيات قابلة للتنفيذ لإدماج HLV في تصميم قواعد البيانات، ما يسهم في الحفاظ على القيم الإنسانية المتعددة بشكل أفضل.