في عالم الذكاء الاصطناعي، تعتبر مهام التقسيم الدقيق القليل الإشراف (Weakly-Supervised Few-Shot Segmentation) من المجالات المتقدمة التي تواجه تحديات معقدة. في بحث جديد بعنوان "من خلال المرآة: منظور مزدوج حول التقسيم الدقيق القليل الإشراف"، يسلط الباحثون الضوء على الطرق المبتكرة التي تدفع حدود هذه التقنيات.
تسعى آليات التعلم الميتا (Meta-learning) إلى عينة موحدة من أزواج التعليم والدعم المتجانسة، لكن التصميم الشبكي المتطابق يؤدي إلى فرط تجانس المعاني. لمواجهة هذه المشكلة، يقترح فريق البحث نموذجًا شبكيًا مبتكرًا يجمع بين التجانس والتنوع. من خلال النظر إلى أزواج التعليم والدعم كمنظور مزدوج، تم تقديم وحدات التجميع البصري غير المتجانس (Heterogeneous Visual Aggregation - HA) لتعزيز التوافق مع الحفاظ على الخصائص الدلالية المشتركة.
علاوة على ذلك، تم تصميم وحدة النقل غير المتجانسة (Heterogeneous Transfer - HT) لتقليل الضوضاء الدلالية وزيادة تميز المعاني المتنوعة. في النهاية، تم تقديم معلومات نصية جديدة تحت مسمى CLIP غير المتجانس (Heterogeneous CLIP - HC) لتعزيز قدرة النماذج متعددة الوسائط على التعميم.
أثبت النموذج الجديد TLG تحقيقه لتحسينات ملحوظة، حيث تمكّن من الحصول على نسبة 13.2% في تحسين دقة التقسيم على مجموعة بيانات Pascal-5i، و9.7% على مجموعة COCO-20i، مع استخدام 1/24 من معلمات النماذج الحديثة المعتمدة على الإشراف الكامل. ومن المثير للاهتمام أن TLG هو النموذج الأول من نوعه الذي يتفوق على النماذج المعتمدة على الإشراف الكامل باستخدام نفس الهياكل الأساسية.
للمطورين والباحثين المهتمين، الكود متاح على GitHub [https://github.com/jarch-ma/TLG]. في ضوء هذه التطورات المثيرة، ما رأيكم في مستقبل التقنيات القليلة الإشراف في الذكاء الاصطناعي؟ شاركونا آراءكم في التعليقات!
من خلال المرآة: منظور مزدوج حول التقسيم الدقيق القليل الإشراف
تقدم الدراسة الجديدة نموذجًا مبتكرًا يحقق تحسينات ملحوظة في مهام التقسيم الدقيق مع القليل من الإشراف. باستخدام أساليب جديدة لتعزيز التوافق والتنوع في المعطيات، تسجل نتائج مذهلة مقارنةً بالنماذج المعتمدة على الإشراف الكامل.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
