تُعتبر النماذج المعززة للرؤية (Vision Models) من أهم الابتكارات في مجال الذكاء الاصطناعي، إلا أن هذه النماذج تعاني من صعوبة في تصنيف البيانات التي تتعرض لتحولات مثل التدوير أو القياس أو القص، رغم أن هذه التحولات لا تؤثر على الفئة الأساسية للشيء. في استمرار للبحث عن تحسينات في دقة التصنيف، تم تقديم منهجية جديدة تُعرف بالكانونيكية في وقت الاختبار (Test-time Canonicalization).
تعمل هذه الطريقة على تفكيك التحول الذي تخضع له كل صورة، مما يُعيد تشكيلها إلى نموذج قياسي يتوافق مع توزيع بيانات التدريب. على عكس الأساليب التقليدية التي تتطلب إعادة تدريب أو تعديل للمعمارية، يبقي النظام الكانونيكي المصنّف غير متأثر ويستفيد من قدرات النموذج الأصلي بشكل كامل.
ومع ذلك، كان النموذج السابق يعتمد على مجموعة ضيقة من مقاييس الطاقة المرتكزة على اللوغاريتمات، مما ترك تصميم الوظائف المثلى غير مستكشف. هنا يأتي الابتكار الجديد الذي يعيد صياغة الكانونيكية كعملية اكتشاف للبيانات خارج نطاق التوزيع (Out-of-Distribution Detection)، مما يتيح لأي مقياس OOD أن يعمل كطاقة يتم تقليلها عبر التحولات.
عبر مجموعة من الاختبارات التي تشمل رغبات خط اليد، والرسومات، والصور الطبيعية، ونقاط ثلاثية الأبعاد، قام الباحثون بتقييم حوالي عشرين مقياس OOD وتسعة خوارزميات بحث، حيث أثبتت النتائج أن المقاييس المعتمدة على المسافة عند اقترانها مع البحث العشوائي والتحسين المحلي تتصدر قائمة الأداء.
الأكثر إثارة هو إضافة آلية تغلق المدخلات غير الضرورية عندما تشير مقاييس OOD إلى الحاجة لذلك، مما يُحافظ على دقة التوزيع المعروف بينما يضمن زيادة المقاومة للمدخلات المحوّلة. يمكنكم الاطلاع على الشيفرة المصدرية عبر رابط [GitHub للمشروع].
هل تعتقد أن هذه الابتكارات قد تساهم في تقديم مزيد من التطورات في مجال الرؤية الاصطناعية؟ شاركونا آراءكم في التعليقات!
ثورة في تصنيف الصور: كيفية تحسين دقة النماذج باستخدام الكانونيكية في وقت الاختبار!
تشهد تقنيات تصنيف الصور تطوراً مذهلاً بفضل منهجية جديدة تعرف بالكانونيكية في وقت الاختبار. هذه الطريقة تعد بتقديم تحسن كبير في دقة التصنيف دون الحاجة لتعديل النماذج الأصلية.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
