لعدة سنوات، كان يُعتقد أن الانحيازات الجيواستراتيجية في نماذج اللغة تُنسب بشكل أساسي إلى بيانات التدريب المستخدمة خلال مرحلة ما قبل التدريب. لكن دراسة حديثة أظهرت أنه من الممكن أن تكون هذه الانحيازات أكثر تعقيدًا مما كنا نعتقد، حيث تنشأ بشكل رئيسي خلال مرحلة ما بعد التدريب.
اختبر فريق البحث سبعة أزواج من نماذج اللغة مفتوحة الوزن، والتي تتكون من النموذج الأساسي (الذي خضع فقط لمرحلة ما قبل التدريب) والنموذج المحسن (الذي خضع لكل من مرحلة ما قبل التدريب وما بعده)، عبر 28 دولة مستخدمين ثلاث لغات: الإنجليزية، الفرنسية، والصينية. النتائج أثبتت أن الانحياز الجيواستراتيجي يظهر ويزداد بعد مرحلة ما بعد التدريب، وليس أثناء مرحلة ما قبل التدريب.
الأكثر إثارة للاهتمام، هو أن غالبية المختبرات السبعة التي شاركت في الدراسة أظهرت تحولات في اتجاه الانحياز المرتبط بالدولة أو المنطقة التي ينتمي إليها مطور النموذج. مثلاً، نموذج "كوان 2.5" من "علي بابا" أظهر تغيرًا كبيرًا بعد التدريب، حيث أصبح مؤيدًا أكثر للصين بمعدل 18 مرة مقارنة بالنموذج الأساسي.
وبالإضافة إلى ذلك، أكدت النتائج أن طريقة طرح الأسئلة، وأسلوب اللغة المستخدم في التفاعل مع النموذج، يلعبان دورًا محوريًا في تشكيل هذه الانحيازات. نموذج "ميستريل"، على سبيل المثال، أصبح مؤيدًا لفرنسا فقط عندما يُطرح عليه بالفرنسية.
تشير هذه الاكتشافات إلى أن التوجهات الجغرافية السياسية في نماذج اللغة ليست مجرد إرث من البيانات المتاحة على الإنترنت، بل هي ناتجة عن التدخل النشط خلال مرحلة ما بعد التدريب. هذا يسلط الضوء على الحاجة الملحة لتعزيز الشفافية والرقابة على العمليات التي تؤثر على كيفية تمثيل النماذج للأمم والثقافات ووجهات النظر السياسية.
البشر لا البيانات: مصدر التحامل الجيواستراتيجي في نماذج اللغة بعد التدريب
دراسة جديدة تكشف أن الانحياز الجيواستراتيجي في نماذج اللغة يعتمد على مرحلة ما بعد التدريب، وليس على بيانات التدريب فقط. النتائج تبرز ضرورة تحسين الشفافية والرقابة في تطوير هذه النماذج.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
