في عالم [الذكاء الاصطناعي](/tag/الذكاء-الاصطناعي) ([AI](/tag/ai))، يعد [دقة](/tag/دقة) [العدالة](/tag/العدالة) في القرارات الحيوية من الأمور المحورية التي تتطلب فهمًا عميقًا للعوامل المختلفة التي تؤثر على النتائج. لقد أكدت [الأبحاث](/tag/الأبحاث) الأخيرة حول [نماذج [اللغات](/tag/اللغات) الضخمة](/tag/[نماذج](/tag/نماذج)-[اللغات](/tag/اللغات)-الضخمة) (Large Language [Models](/tag/models)) أن هذه [النماذج](/tag/النماذج) تتمتع بسلوك عادل في اتخاذ [قرارات](/tag/قرارات) ذات [مخاطر](/tag/مخاطر) كبيرة. ومع ذلك، تكمن المشكلة في أن [التحيزات](/tag/التحيزات) المرتبطة بها لم تختفِ تمامًا بل لا تزال موجودة في تمثيلاتها الداخلية.
تُظهر [الأبحاث](/tag/الأبحاث) التي أجريت على [نماذج مفتوحة](/tag/[نماذج](/tag/نماذج)-مفتوحة) الوزن في مجال إعداد قروض الرهن العقاري (mortgage underwriting) أن هناك خللاً خطيرًا. على الرغم من أن النتائج التي توصلت إليها هذه [النماذج](/tag/النماذج) خالية من [التحيز](/tag/التحيز) الظاهر، إلا أنها تحتفظ بل وتعزز التمثيلات الديموغرافية [عبر](/tag/عبر) الطبقات المختلفة للنموذج. وقد استخدم الباحثون [تقنيات](/tag/تقنيات) مثل [توجيه التنشيط](/tag/[توجيه](/tag/توجيه)-التنشيط) (activation steering) والتدخلات [عبر](/tag/عبر) الطبقات (cross-layer interventions) لإثبات أن هذه [المعلومات](/tag/المعلومات) المكبوتة هي ذات صلة في [اتخاذ القرارات](/tag/اتخاذ-القرارات).
عند إعادة إدخال هذه [المعلومات](/tag/المعلومات) في الطبقات الحرجة، يمكن أن تتسبب في انعكاسات كاملة تقريبًا في القرارات المتخذة. وتجدر الإشارة إلى أن هذا [التحيز](/tag/التحيز) الخفي ليس متساويًا، إذ تؤثر التدخلات فقط في اتجاه ديموغرافي معين مع آثار ضئيلة في الاتجاه المعاكس. كما أن هذه [النماذج](/tag/النماذج) تكون عرضة للهندسة التلقائية الضارة (adversarial prompt engineering) والتعديل الفعال للمعلمات.
هذه النتائج تبرز النقطة الهامة أن [تدقيق](/tag/تدقيق) السلوكيات المرتكز على النتائج قد لا يكفي، إذ يمكن أن تخفي النتائج العادلة [تحيزات](/tag/تحيزات) داخلية قابلة للاستغلال. وبدلاً من ذلك، يدعو الباحثون إلى اعتماد أطر اختبار مزدوجة تجمع بين [تقييم](/tag/تقييم) المخرجات والتحليل التمثيلي لضمان [الحوكمة](/tag/الحوكمة) الفعالة لنماذج [الذكاء الاصطناعي](/tag/الذكاء-الاصطناعي) في [قرارات](/tag/قرارات) ذات [مخاطر](/tag/مخاطر) عالية.
هل تعتقد أن [العدالة في الذكاء الاصطناعي](/tag/[العدالة](/tag/العدالة)-في-الذكاء-الاصطناعي) يمكن تحقيقها حقًا؟ شاركونا آرائكم في [التعليقات](/tag/التعليقات).
تحديات العدالة في نماذج الذكاء الاصطناعي: كيف تؤثر التحيزات الداخلية على القرارات الكبيرة؟
تُظهر نماذج اللغات الضخمة سلوكاً عادلاً في قرارات ذات مخاطر عالية، لكن التحيزات الداخلية قد تؤثر على النتائج. يكشف بحث جديد عن الصلة بين المظاهر الخارجية والأبعاد الخفية لهذه التحيزات.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
