في عالم الذكاء الاصطناعي، يواجه الباحثون والممارسون تحدياً كبيراً يتمثل في التقييم غير العادل للأداء، خاصة في التصنيفات غير المتوازنة. إذ يمكن أن تؤدي التقييمات التقليدية إلى نتائج مضللة، حيث تُظهر أن النماذج تؤدي جيداً بشكل عام بينما تفشل في تقديم أدائها الفعلي لفئات فرعية معينة داخل نفس الفئة.

أظهرت الأبحاث السابقة أن المقاييس الشائعة المستخدمة في التصنيف غير المتوازن تميل إلى التحيز تجاه المفاهيم الفرعية الأكثر شيوعاً، مما يعني أن المفاهيم الفرعية الأقل تمثل عادةً تحدياً أكبر. ولكن، تحتاج هذه الفئة في بعض الأحيان إلى تقييم دقيق لفهم أدائها الحقيقي.

لذلك، قدم الباحثون تقنية جديدة تدعى "الدقة المتوازنة الموزونة المتوقعة" (predicted-weighted balanced accuracy) والتي تعتمد على تقييمات الوزن القائم على الفائدة. ومن خلال استبدال التسميات غير المتوفرة للمفاهيم الفرعية مع احتمالات ما بعد النموذج المتعدد الفئات، يمكن لهذه التقنية أن تقدم مقياسًا أكثر استقرارًا وفهمًا في الحالات التي تكون فيها التوزيعات غير متساوية.

أظهرت التجارب على اختبارات سهلة وعلى مجموعات بيانات طبية ونصية أن النتائج غير الموزونة قد تكون مضللة بسبب التباين داخل الفئة، لكن الدقة المتوازنة الموزونة المتوقعة تمكنت من تقديم تقييمات أكثر وضوحًا.

لمعرفة المزيد واستكشاف الكود المستخدم في هذه الأبحاث، يمكنكم زيارة: [https://anonymous.4open.science/r/correcting-bias-imbalance-9C6C/]. ويبدو أن هذا البحث يعد خطوة مهمة نحو تطوير نماذج ذكاء اصطناعي أكثر دقة وموضوعية.