في عالم الذكاء الاصطناعي، يلعب [التصنيف](/tag/التصنيف) البصري الدقيق (Fine-Grained Visual Classification - FGVC) دوراً محورياً، حيث يتطلب من [النماذج](/tag/النماذج) التركيز على تفاصيل دقيقة في [الصورة](/tag/الصورة) بدلاً من الخلفيات العامة. هنا يأتي دور وحدة 'لوبي' الجديدة، وهي وحدة خفيفة الوزن قابلة للتوصيل والتشغيل تهدف إلى تعزيز فعالية [محولات الرؤية](/tag/[محولات](/tag/محولات)-[الرؤية](/tag/الرؤية)) ([Vision Transformers](/tag/vision-transformers)).
تم [تصميم](/tag/تصميم) 'لوبي' لتكون مضافة في مرحلة الميزات الوسيطة، حيث تعمل على [التنبؤ](/tag/التنبؤ) بقناع مكاني أحادي القناة باستخدام شبكة [عصبية](/tag/عصبية) مُدمجة ([CNN](/tag/cnn)) صغيرة. يتيح ذلك إعادة وزن تفعيل الميزات خلال عملية [التدريب](/tag/التدريب) الشاملة، من خلال استخدام هدف [الانتروبيا](/tag/الانتروبيا) المتقاطعة (cross-entropy) وشرط الشحّ (l1 sparsity).
أثبتت [التجارب](/tag/التجارب) التي أجريت على [مجموعة بيانات](/tag/مجموعة-[بيانات](/tag/بيانات)) [CUB](/tag/cub)-200-2011 أن 'لوبي' ساهمت في [تحسين أداء](/tag/[تحسين](/tag/تحسين)-[أداء](/tag/أداء)) [نموذج](/tag/نموذج) Swin-Base من 88.36% إلى 91.72%، وزيادة [أداء](/tag/أداء) Swin-Tiny من 85.14% إلى 88.61%، مع إضافة أقل من 0.1% من المعلمات.
تظهر النتائج [التفسيرية](/tag/التفسيرية) أن القناع المُتعلم غالباً ما يتماشى مع الأجزاء التمييزية للطيور، على الرغم من أن الوحدة ليست بديلاً للتوجيه على مستوى الأجزاء، وقد تواجه صعوبات تحت ظروف التداخل أو الاختلافات الدقيقة بين الأجزاء. يبرز هذا التطور الجديد أهمية استخدام [تقنيات التحكم](/tag/[تقنيات](/tag/تقنيات)-[التحكم](/tag/التحكم)) في البوابات المكانية، مما يجعلها أكثر فعالية مقارنةً بتقنيات [التغطية](/tag/التغطية) متعددة المقاييس التقليدية.
إذا كنت متحمسًا لتقنيات [الذكاء الاصطناعي](/tag/الذكاء-الاصطناعي) وترغب في [التعرف](/tag/التعرف) على كيفية تقدم [الأبحاث](/tag/الأبحاث) في هذا المجال، فلا تتردد في متابعتنا وشاركنا آراءكم حول هذه الوحدة الجديدة والتطورات السابقة.
لوبي: وحدة جديدة لتعزيز ميزات التمييز في المحولات البصرية بفضل تقنيات الذكاء الاصطناعي!
استكشفوا وحدة 'لوبي' الجديدة، التي تمكن نماذج Vision Transformers من تحسين دقتها في التصنيف البصري الدقيق. بإضافة هذه الوحدة، تحقق نماذج SWIN تحسناً ملحوظاً في الأداء مع عدد إضافي ضئيل من المعلمات!
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
