في ظل التطورات المتسارعة في مجال الذكاء الاصطناعي، تظهر نماذج اللغات الضخمة (Large Language Models) كأحد أبرز الابتكارات التي يتزايد الاهتمام بفحص تحيزاتها. ومن هنا، يأتي دور الإطار الإحصائي الجديد المبتكر لتقييم ظاهرة التداخل (Associative Interference) في هذه النماذج.

اعتمد البحث على اختبار الارتباط الضمني (Implicit Association Test) بإعادة تطبيقه في إطار تحكمي يعتمد على الاختيار القسري، حيث قام الباحثون بتطوير نهج نمذجي من مرحلتين يفصل بين استجابة النموذج ومواءمتها مع المهمة المعطاة. تم تقييم ثلاثة نماذج معاصرة، وهي Claude Sonnet-4 وGemini 2.5 Pro وGPT-5، من خلال فحص التأثيرات التداخلية التي تعكس الانخفاض في الاتساق مع المهمة في الظروف غير المتوافقة مقارنة بالتوافقية.

أظهرت النتائج أن نماذج Claude Sonnet-4 تعرضت لمستويات عالية من التداخل في مجال الجنس والمهنة، بينما كانت التأثيرات في نموذج Gemini 2.5 Pro أقل. أما GPT-5، فقد أظهر تأثيرات تداخل ضئيلة أو غير قابلة للاكتشاف عبر المجالات المختلفة.

تسلط هذه النتائج الضوء على ضرورة التقييم النموذجي، حيث إن التداخل التفاعلي ليس سمة عالمية لكل النماذج، وإنما يعتمد بشكل كبير على خصائص كل نموذج على حدة. إذن، كيف يؤثر هذا التقييم المبتكر على مستقبل تطوير نماذج الذكاء الاصطناعي؟

ما رأيكم في هذه التطورات الجديدة في مجال الذكاء الاصطناعي؟ شاركونا في التعليقات.