في دراسة حديثة، تم التحقيق في تأثير الجنس والعمر على توصيات الفرز الطبي من قبل نماذج اللغة الكبيرة (Large Language Models). استخدمت الدراسة ثلاثة نماذج رائدة: Gemini 3.5 Flash وClaude Sonnet 4.6 وGPT-5.4-mini. تم تقديم ملف أعراض موحد يتضمن صداعاً مستمراً، ورؤية ضبابية، وغثيان صباحي، واضطرابات بصرية، عبر سبع مجموعات ديموغرافية تشمل ثلاثة أعمار (25، 38، و65 سنة) وجنسين (ذكر، وأنثى)، بالإضافة إلى مجموعة مرجعية غير محددة الجنس.
أظهرت النتائج وجود فجوة واضحة في توصيات فرز الطوارئ، حيث كانت نسبة إحالة النساء الشابات إلى أقسام الطوارئ أقل بكثير من الرجال في نفس العمر. على سبيل المثال، أظهرت نموذج Gemini نسبة إحالة 0% للنساء الشابات مقابل 23.3% للرجال، في حين كانت النتائج في نموذج Claude 6.7% مقابل 96.7%، مما يشير إلى تباين صارخ وبحاجة ملحة للتغيير.
تظهر النتائج أن النماذج ترتكز على تشخيصات مرتبطة بالجنس، حيث يتم تصنيف النساء الشابات بشكل تفضيلي كمعانات من ارتفاع الضغط داخل الجمجمة مجهول السبب، بينما يتم تشخيص الرجال بوجود آفات تشغل حيزًا مع زيادة الضغط داخل الجمجمة. هذا يوجه النساء إلى رعاية ذات مستوى طوارئ أقل رغم شدة أعراضهن المتشابهة.
تشير هذه النتائج إلى أن نماذج الذكاء الاصطناعي قادرة على إعادة إنتاج التحيزات السريرية البشرية، مما يعكس الحاجة إلى فصل تقييمurgency عن الاحتمالات التشخيصية المستخدمة. من خلال هذه الدراسة، تم إطلاق جميع الأكواد، والنماذج، والنتائج الخام للجمهور لتطوير مستقبلي مسؤول في هذا المجال.
التمييز في تشخيص حالات الطوارئ الطبية: كيف تؤثر التقنية على المساواة بين الجنسين؟
تشير الأبحاث إلى وجود تباين كبير في توصيات الفرز الطبي بين الجنسين، مما يؤكد على الحاجة لتعديل نماذج الذكاء الاصطناعي. النساء الشابات يعانين من إهمال في مستوى الطوارئ رغم وجود أعراض مماثلة.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
