في عصر البيانات الكبيرة، يواجه الباحثون تحديات كبيرة في تدريب نماذج التعلم العميق، خاصةً في مجالات مثل تقطيع الصور (Semantic Segmentation). إذ تعاني هذه النماذج من قلة البيانات النادرة أو الصعبة بصرياً، مثل المناطق الكثيفة أو الأجسام الصغيرة في البيانات الجوية أو بيانات التنقل الذاتي. تعتبر تقنيات تعزيز البيانات الاصطناعية (Synthetic Data Augmentation) حلاً مُغريًا، ولكنها تحمل مخاطر عدم توافق العلامات مع البكسلات المولدة.

لبحث المشكلة بعمق، نجد أن الحلول الحالية غالبًا ما تعتمد على نماذج خارجية أو تستخدم تقنيات خادعة مثل تعزيز جميع الأجسام أو الخلفيات بشكل عشوائي، مما يعد تضييعًا للقدرة على البيانات غير المفيدة. ولكن، ماذا لو قدمنا استراتيجية تعزيز سياقية قائمة على الشكوك بحيث نضمن سيرة العلامات ونعظم معلومات البكسل المولدة؟

نقترح هنا نهجًا جديدًا يعتمد على الشكوك لتوجيه تعزيز السياق الاصطناعي، مما يحافظ بشكل صارم على صحة العلامات، ويركز على المناطق غير المؤكدة بصريًا. نعتمد في ذلك على انطباق كثافة التوقع (Predictive Entropy) لنموذج التقسيم الأساسي، حيث نحدد المناطق غير المؤكدة ونقوم بملء السياقات البصرية التكميلية فقط. وعند تحسين النموذج باستخدام هذه البيانات الاصطناعية، نقلل الخسارة اعتبارًا من البكسلات الأصلية فقط، مع استبعاد المناطق المملوءة.

لقد استطعنا بالتالي تحسين الأداء بشكل ملحوظ على مجموعة بيانات Cityscapes وUAVID وBDD100K، مع تحقيق أكبر المكاسب في الفئات النادرة والصعبة مثل الحافلات والقطارات والسيارات. تؤكد نتائجنا أن تعزيز السياق المعتمد على الشكوك هو وسيلة فعالة جدًا لتحسين أداء نماذج التقسيم على مجموعات بيانات معقدة.

للمزيد من التفاصيل حول الكود يمكنكم زيارة الرابط GitHub Repo. ما رأيكم في هذا التطور المبتكر؟ شاركونا آرائكم في التعليقات!