تواجه نماذج التصنيف تحت إشراف تحديات كبيرة عند وجود تماثل غير متوازن، خاصة في المجالات الحرجة مثل تشخيصات الطبية والكشف عن الشذوذ. وغالباً ما يتم البحث عن تقنيات إعادة التوازن لمعالجة هذه المسألة، لكن القليل من الأبحاث تركز على أداء المصنّفات الثنائية عندما لا يتم تطبيق مثل هذه التقنيات. تهدف الدراسة الجديدة إلى تقييم أداء المصنّفات الثنائية 'كما هي'، دون أي إعادة توازن صريح.

قمنا بتقييم شامل لخمسة مصنّفات ثنائية متنوعة عبر مجموعات بيانات حقيقية وصناعية، مع تقليص تدريجي لأحجام الفئة الأقل تمثيلاً، مما يعكس سيناريوهات 'لقطة واحدة' و'عدد قليل من اللقطات' كنقاط انطلاق. تم تصميم تجاربنا لدراسة تباين تعقيد البيانات من خلال توليد الحدود القرارية الصناعية لمحاكاة الظروف الواقعية.

تنطلق التجارب أيضاً لتشمل استراتيجيات عينات ناقصة وزائدة، بالإضافة إلى طرق التصنيف الأحادى لفحص سلوكها تحت ظروف التماثل الشديد. تكشف النتائج أن التعقيد المتزايد في البيانات وأحجام الفئة الأقل تسببا في صعوبة أكبر في عملية التصنيف. بينما تتراجع أداء المصنّفات التقليدية تحت تأثير التماثل المفرط، فإن النماذج المتقدمة مثل TabPFN والحزم المستندة إلى التعزيز تحتفظ بأداء مرتفع نسبيًا وتعميم أفضل.

تؤكد أدوات التقييم والبيانات البصرية هذه النتائج وتعطي توجيهات قيمة حول اختيار النماذج لتعليم غير المتوازن. تدعو هذه الدراسة الباحثين وصناع القرار لفهم كيفية عمل المصنّفات في ظروف غير متوازنة لتحقيق نتائج أفضل دون الاعتماد على التقنيات التقليدية لإعادة التوازن.