في عالم الذكاء الاصطناعي، تُعتبر مهمة وضع علامات حدودية على الأجسام (Bounding Boxes) من المهام الشاقة والمكلفة، مما يحد من قدرة أنظمة الكشف عن الأجسام على التوسع. غالباً ما تأتي هذه التحديات مصحوبة بحاجة ملحة للحفاظ على مستوى عالٍ من الدقة، في حين تتم محاولة تقليل الجهد اليدوي في التطبيقات الواقعية.
تقنيات التعلم النشط السابقة اعتمدت بشكلٍ كبير على ميزات النماذج أو غيرت من بنية المعدّات وموعد التدريب، مما يزيد من الأعباء. لكنها نادراً ما استغلت بشكلٍ شامل فوائد إشارات مستوى الصورة (Image-Level Signals) والاختلال في توزيع الفئات (Class-Imbalance Cues) والشكوك على مستوى الكائنات (Instance-Level Uncertainty) لاختيار البيانات بشكل شامل.
هنا تأتي تقنية التعلم النشط المحمول (Portable Active Learning - PAL) لتقدم إطار عمل يعمل بشكل مستقل عن النماذج، مما يجعله سهل النقل وقابل للاستخدام مع مختلف أنظمة الكشف. تعتمد تقنية PAL على دمج مستوى عدم اليقين من الفئة مع تنوع الصورة لتوجيه عملية اختيار البيانات. في كل جولة، تقوم PAL بتدريب مصنفات لوجستية خفيفة خاصة بكل فئة لتفريق بين الإيجابيات الحقيقية والمزيفة، مما ينتج عنه درجات عدم اليقين بناءً على الانتروبيا للاقتراحات.
تتم تصفية الصور المرشحة باستخدام انتروبيا الصورة العالمية، وتنويع الفئة، وتبادل الصور، مما ينتج دفعات مليئة بالمعلومات ومتنوعة في ذات الوقت. لا تتطلب تقنية PAL أي تغييرات داخلية في النماذج أو في خطوط أنابيب التدريب، مما يضمن توافقاً واسعاً مع مختلف أجهزة الكشف.
تُظهر التجارب المكثفة التي تمت على مجموعات بيانات مثل COCO وPASCAL VOC وBDD100K أن PAL تساهم في تحسين كفاءة وضع العلامات ودقة الكشف بصورة ملحوظة مقارنة بالأساليب السابقة للتعلم النشط، مما يجعلها حلاً عمليًا للتوزيع القابل للتوسع والفعال من حيث التكلفة في مجال كشف الأجسام في التطبيقات الواقعية.
تعلم نشط محمول: ثورة جديدة في كشف الأجسام بدقة عالية
تقدم تقنية التعلم النشط المحمول (PAL) حلاً مبتكرًا لتوسيع نطاق كشف الأجسام بكفاءة، من خلال تقليل الجهد اليدوي وزيادة دقة الكشف. تضمن هذه الطريقة الحفاظ على فعالية التصنيف دون الحاجة لتعديل نماذج الكشف.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
