في عالم الذكاء الاصطناعي، تلعب نماذج الرؤية واللغة (Vision-Language Models) دورًا كبيرًا في تحديد النتائج الطبية الدقيقة. دراسة جديدة تم نشرها مؤخرًا تسلط الضوء على أهمية التعامل مع الإشارات الضوضائية (Noisy Labels) وكيف يمكن أن تؤثر على أداء النماذج تحت إشراف ضعيف.

استندت الدراسة إلى نظرية الإشارات الضوضائية التقليدية، والتي تقترح أن الأداء في ظل إشراف ضعيف يتوقف على دقة المصنف. إذا تمكن المصنف المدرب من الوصول إلى نفس مستوى دقة المصنف البشري، فإن فائدة الإشارات الضوضائية تتلاشى وقد تصبح ضارة.

قمنا بتقديم تحسين يعتمد على هذه النظرية من خلال تقييم دقة الإشارات الضوضائية التي تم إنشاؤها بواسطة BiomedCLIP على ثلاثة معايير من التصوير الطبي (PCAM، ISIC، NIH-CXR) مع ستة معمارية مختلفة تمتلك نطاقًا واسعًا من عدد المعلمات.

أظهرت النتائج أن النقطة الحرجة التي تنبأت بها النظرية تظهر في تدريجات معينة لكل معيار؛ حيث تؤدي الإشارات الضوضائية التي تتجاوز هذه النقطة إلى تدهور في دقة النتائج بنسبة تصل إلى -0.10. أظهرت أيضا التحليلات أن تأثير النقطة الحرجة كان متسقًا تقريبًا عبر أربع من أصل خمس معمارية مُدربة مسبقًا.

يُعتبر هذا التحسين دليلاً عمليًا لما يمكن تحقيقه من خلال مقارنة دقة النتائج للأشخاص والمصنفين على مجموعة البيانات الذهبية. كما أظهرت النتائج كيف أن إعادة صياغة القوانين لاستيعاب إشارات الضوضاء يمكن أن تفتح آفاقًا جديدة للأبحاث المستقبلية.