في عالم الذكاء الاصطناعي (Artificial Intelligence)، يعتمد الكثير من البحث والتطوير على التغذية الراجعة من المستخدمين. لكن ماذا يحدث عندما نتجاهل تعقيدات آراء البشر ونختزلها إلى هدف مكافأة واحد؟ تشير دراسة جديدة إلى أن هذا النهج قد يكون ضارًا أكثر مما نتخيل، ويؤدي إلى ما يسمى بـ"ضغط صحة التفضيلات" (Preference-Validity Compression).

تستند الدراسة إلى تجارب أجريت في ماليزيا، حيث تم تحليل ردود الفعل التي تُجمع بطريقة مشابهة لأنظمة التعلم من التغذية الراجعة البشرية (RLHF). من خلال دراسة 321 حدثًا تفضيليًا من 20 مشاركًا، وجد الباحثون أن 79% من البيانات قد تحتوي على أكثر من استجابة مُدعمة بالأغلبية، بينما تنقضُّ عملية الجمع على تنوع الآراء هذا.

تظهر النتائج أن عملية دمج الآراء قد تؤدي إلى تجاهل التفسيرات الثقافية واللغوية المهمة، مما يُقلل من دقة قياس توافق الآراء. هذه الفجوة تبرز أهمية تطوير أساليب جديدة تعمل على الحفاظ على صحة القياس، من خلال قبول الآراء المتعددة بدلاً من التركيز على هدف مكافأة واحد.

لذا، هل نحن في حاجة لتغيير كيف نقيم التفضيلات في نظم الذكاء الاصطناعي؟ هذه النتائج تدعو العاملين في هذا المجال للتفكير في كيفية تحسين أساليب القياس لتحقيق العدالة والفهم الحقيقي للتنوع البشري.