في السنوات الأخيرة، أصبح الاعتماد على نماذج اللغة والرؤية الضخمة (Large Vision-Language Models) أكثر شيوعاً، ولكن مع هذا الانتشار، بدأت مخاوف جديدة بشأن العدالة والإنصاف تُثار، خاصةً فيما يتعلق بتعزيز الصور النمطية الضارة على مستوى المجتمع. بينما تم تناول هذه المخاوف بشكل واسع في سياق التحيزات الاجتماعية، إلا أنه لم يتم تسليط الضوء على وجود الصور النمطية المتعلقة بالسياقات الثقافية مثل الدين والجنسية والوضع الاجتماعي-الاقتصادي.

تسعى الدراسة الحالية إلى سد هذه الفجوة من خلال تحليل كيف تؤثر السياقات الثقافية التي تُظهرها الصور على تقديرات نماذج اللغة والرؤية الضخمة للقيم الأخلاقية، والسياسية، والأخلاقية للأفراد. قامت الدراسة بإجراء تحليلات متعددة الأبعاد لتقديرات القيم في تسعة نماذج، مستخدمةً مجموعات صور تمثل نفس الشخص في سياقات ثقافية متنوعة.

استخدمت الدراسة إطار تقييم يجمع بين التحليلات الوصفية (تصنيف نظرية الأسس الأخلاقية، التحليلات اللفظية، وحساسية القيم) و تحليل جديد يقارن تباين النماذج عبر السياقات مع استطلاعات الرأي البشرية واسعة النطاق مثل (MFQ-2 و WVS Wave 7). عبر 4.8 مليون جيل من النماذج، تم التعرف على ثلاثة أنماط تحيزات تتكرر عبر نماذج معمارية متنوعة: انقلاب علاقة الوضع الاجتماعي-الاقتصادي بالسلطة، وفشلان مشروطان بالعرق يتجاوزان الملاحظات الثقافية عند تصوير الأفراد من الشرق الأوسط.

تشير التفاعلات الإضافية إلى أن تحيز انقلاب الوضع الاجتماعي-الاقتصادي بالسلطة يتفاقم بفعل تكييف الصور ويستمر عبر أحجام مختلفة من النماذج. إن فهم هذه التحيزات يعتبر خطوة حاسمة نحو تطوير نماذج أكثر عدلاً وشمولية.

هل تعتقد أن نماذج الذكاء الاصطناعي يجب أن تراعى في تصميمها لتفادي هذه التحاملات الثقافية؟ شاركونا آراءكم في التعليقات!