تعتبر نماذج اللغات الضخمة (Large Language Models) جزءًا مهمًا من تقنية الذكاء الاصطناعي، حيث يتوجب عليها تلبية احتياجات وتفضيلات ثقافات فرعية متعددة بشكل مقبول. ومع ذلك، ركزت الأبحاث السابقة على توقع استجابة موحدة للمستخدمين من مناطق معينة، مما أفسح المجال للكثير من التحيزات.

في خطوة جديدة، يهدف بحث حديث إلى تطوير نماذج توافق أكثر شمولية، مع التركيز على تفضيلات الثقافات المختلفة. هذا البحث يقدم خوارزمية مبتكرة لتدريب نماذج المكافآت (Reward Models) تُعرف باسم SCPO، والتي تعتمد على دمج تفضيلات ثقافية متنوعة بشكل متوازن.

تظهر النتائج أن هذه الطريقة تؤدي إلى زيادة في أداء نموذج المكافآت الأقلية تصل إلى 7 نقاط على نموذج الأساس، عبر مجموعتين بيانات PRISM وGlobalOpinionQA، وكذلك عبر 7 دول مختلفة. كما أن SCPO يُظهر كفاءة تدريب أعلى تبلغ 280% مقارنةً بالطريقة التقليدية لتدريب نماذج المكافآت.

علاوة على ذلك، فإن البحث يتناول تحليل التحيز من خلال تقييم تفضيلات الثقافات الفرعية بشكل منفصل، مما يكشف أن أسلوب الوزن الذي تم تطويره يساهم في تقليل التحيز المفرط.

للراغبين في استكشاف هذه التقنية أكثر، يمكنكم زيارة كوب البحث على GitHub: رابط.

كيف ترى تأثير نماذج المكافآت الثقافية الجديدة على مساهمة الذكاء الاصطناعي في المجتمع؟ شاركونا آرائكم.