في عالم الذكاء الاصطناعي، يُعتبر الحفاظ على استقرار الإخراجات أثناء استخدام النماذج اللغوية الضخمة (Large Language Models) أمرًا مفترضًا. لكن دراسة جديدة تثير الشكوك حول هذا المفهوم من خلال فحص كيفية استنتاج الجنس باستخدام نماذج الذكاء الاصطناعي.
أجريت التجارب باستخدام مهمة اختيار ضمير مسيطر، حيث تم تقديم سياقات كلامية بسيطة وذات دلالات نظرية غير مفيدة. النتائج كانت صادمة: تمثّلت في تغييرات كبيرة ومنهجية في مخرجات النماذج عندما تم إدراج هذه السياقات. بينما كانت هناك ارتباطات قوية مع الأنماط الثقافية المرتبطة بالجنس في إعدادات غير سياقية، تضعف هذه الارتباطات أو تختفي تمامًا عند تقديم السياق المناسب.
علاوة على ذلك، اتضح أن ميزات غير مرتبطة مثل جنس الضمير المستخدم في الإشارة إلى شخص غير ذي صلة أصبحت من أقوى المؤشرات المتنبئة بسلوك النماذج. ومن خلال تحليل Contextuality-by-Default، تبين أن 19-52% من الحالات عبر النماذج تحتفظ بهذه الاعتمادية حتى بعد أخذ التأثيرات السياقية الفردية في الاعتبار، ولا يمكن إرجاع هذه التغيرات إلى مجرد تكرار الضمائر.
تسلط هذه النتائج الضوء على فشل نماذج اللغات الضخمة في الحفاظ على الثبات السياقي، حتى عند استخدام صيغ نحوية متشابهة، مما يثير تساؤلات حول موثوقية النماذج في البيئات الحساسة، خصوصًا في قضايا تتعلق بالتحيز والتمييز.
تحطيم الأساطير: كيف يفشل الذكاء الاصطناعي في الحفاظ على الثبات السياقي!
تظهر دراسة جديدة أن نماذج اللغات الضخمة (LLMs) لا تحافظ على سلوكها الثابت عند إدخال تعديلات سياقية بسيطة، مما يؤثر على دقة استنتاجات الجنس. اكتشف كيف تتلاشى الأنماط الثقافية عندما نأخذ السياق بعين الاعتبار.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
