تعد تسميات البيانات الخاطئة في مجموعات تدريب الذكاء الاصطناعي واحدة من أكبر التحديات التي تواجه تطوير الشبكات العميقة (Deep Networks). إذ تميل النماذج ذات عدد المعلمات الكبير إلى حفظ التسميات الخاطئة، مما يؤثر سلبًا على أدائها. ولحل هذه المشكلة، يقدم الباحثون نهجًا مبتكرًا لاكتشاف البيانات ذات التسميات الخاطئة من خلال استغلال ديناميات التدريب.
يهتم النهج المقترح بملاحظة أساسية وهي أن العينات الصحيحة تحمل انخفاضًا مستمرًا في قيم الإنتروبيا خلال عملية التدريب، في حين تحافظ العينات ذات التسميات الخاطئة على مستويات إنتروبيا عالية نسبيًا. بناءً على هذه الرؤية، تم تقديم إحصائية تعرف باسم الإنتروبيا الموقعة (Signed Entropy Integral - SEI)، والتي تلتقط كلاً من حجم وتوجهات الإنتروبيا للتوقعات على مدى فترات التدريب.
تعتبر إحصائية SEI قابلة للتطبيق على شبكة التصنيف (Classification Networks) وتظهر فعالية خاصة عند دمجها مع نماذج ما قبل التدريب للغة والصورة التباينية (Contrastive Language-Image Pretraining - CLIP). من خلال تجارب موسعة على أربعة مجموعات بيانات في مجال التصوير الطبي، وهو مجال يعاني كثيرًا من الأخطاء في التسميات بسبب تعقيد التشخيص، أثبت SEI أدائه الرائد في تحديد البيانات ذات التسميات الخاطئة، متفوقًا على الأساليب الحالية بينما يحتفظ بالكفاءة الحسابية وسهولة التنفيذ.
لمن يرغب في استكشاف هذه التقنية المبتكرة، الشيفرة المصدرية متاحة على GitHub.
ما رأيكم في هذا التطور؟ شاركونا أفكاركم وتجاربكم في التعليقات!
اكتشاف الأخطاء في تسميات الصور باستخدام ديناميات الإنتروبيا: ثورة في تحسين الشبكات العميقة!
تقديم نهج مبتكر يرتكز على ديناميات التدريب لاكتشاف الصور ذات التسميات الخاطئة، مما يحسن بشكل كبير أداء الشبكات العميقة. يكشف البحث عن استراتيجية جديدة تعتمد على حسابات الإنتروبيا الموقعة لمواجهة تحديات تسميات البيانات.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
