في عالم الذكاء الاصطناعي، يعتبر التعلم شبه المراقب (Semi-Supervised Learning) أحد الأساليب الهامة التي تسمح للنماذج بالتعلم من كميات كبيرة من البيانات غير المعلومة، جنبًا إلى جنب مع مجموعات صغيرة من البيانات المعلومة. ومع ذلك، تعد عملية اختيار الملصقات الزائفة (Pseudo-Label Selection) من التحديات الأساسية، حيث تعتمد غالبًا على عتبات الثقة القصوى (Maximum Confidence Thresholds)، مما يعرضها لمخاطر عدم الموثوقية في ظل عدم توازن الفئات وارتفاع الثقة الزائدة للأنموذج.

يقدم الباحثون في هذا المجال تقنية جديدة تُعرف باسم CoVar، التي تعتمد على نموذج الثقة والتباين (Confidence-Variance Framework) لتقييم موثوقية الملصقات الزائفة بشكل أكثر فعالية. يعتمد CoVar على مبدأ تقليل الإنتروبيا (Entropy Minimization) ويظهر من خلال تقريبٍ ثانوي للإنتروبيا المتقاطعة (Cross-Entropy Approximation) أن الملصقات الزائفة ذات الخسائر المنخفضة تكون موثوقة عندما تكون الثقة عالية والتباين في الفئات (Residual-Class Variance) منخفضًا.

تقوم هذه التقنية الجديدة بإدخال توقعات النموذج إلى فضاء ثنائي الأبعاد يتضمن الثقة والتباين، حيث تستخدم استرخاء الطيف القائم على تحليل القيم المفردة (SVD-based Spectral Relaxation) لفصل التوقعات الموثوقة عن غير الموثوقة دون الحاجة إلى عتبات ثقة محددة مسبقًا.

كما تم اعتماد وزن غاوسي (Gaussian Weighting) على مستوى العنقود لتحويل هذا الفصل إلى أوزان تدريب لكل عينة. وبدعم من نتائج التجارب التي اُجريت على مجموعات بيانات شهيرة مثل PASCAL VOC 2012 وCityscapes وCIFAR، أظهرت CoVar نتائج مبهرة في تحسين الأداء العام للنماذج، مما يدل على أن توزيع الفئات المتبقية يوفر إشارة قيمة تعزز من موثوقية اختيار الملصقات الزائفة.

بهذه الطريقة، تمثل CoVar خطوة مهمة نحو تحسين دقة التعلم شبه المراقب، وقد تفتح الأبواب لأبحاث تطوير أخرى في هذا المجال. فما هي توقعاتكم بشأن تأثير هذا الإطار الجديد؟ شاركونا آرائكم في التعليقات!