في عالم الرؤية الحاسوبية، تظل قضايا التحول البيئي (Domain Shift) من التحديات المستمرة، حيث يتطلب الأمر غالبًا تعديلات معقدة على النماذج أو مجموعات بيانات موسعة ذات تسميات. بناءً على الإلهام المستمد من الإحساس البصري البشري، الذي يضبط جودة المدخلات من خلال العدسات التصحيحية بدلاً من إعادة تدريب الدماغ، نقترح تقنية جديدة تُدعى Lens. هذه التقنية تمثل طريقة مبتكرة للتحكم في حساسات الكاميرا، حيث تعزز أداء النماذج من خلال التقاط صور عالية الجودة من منظور النموذج بدلاً من الاعتماد على طرق التحكم التقليدية المتعلقة بالناس.
تتمتع Lens بخفة وزنها، ويمكنها تعديل معلمات الحساسات بما يتناسب مع النماذج والمشاهد في الوقت الحقيقي. يرتكز جوهر Lens على تقنية VisiT، وهي مؤشر جودة محدد للنموذج لا يتطلب تدريبًا مسبقًا، بحيث يقيم عينات غير مُعلمة في وقت الاختبار باستخدام درجات الثقة، وبدون تكاليف إضافية للتكيف.
لتحقيق نتائج مثيرة، قمنا بتقديم مجموعة بيانات ImageNet-ES Diverse، وهي مجموعة مرجعية جديدة تلتقط الاضطرابات الطبيعية الناتجة عن تباين ظروف الحساسات والإضاءة. أظهرت التجارب الواسعة التي أجريناها على كل من ImageNet-ES ومجموعتنا الجديدة ImageNet-ES Diverse أن Lens حسنت بشكل كبير دقة النماذج عبر مختلف آليات التحكم في الحساسات وتعديلات النماذج، مع المحافظة في نفس الوقت على انخفاض وقت الاستجابة في التقاط الصور.
تعتبر Lens فعالة في التعويض عن اختلافات حجم النموذج الكبيرة، وتندمج بسلاسة مع تقنيات تحسين النماذج. يمكنكم الوصول إلى الشيفرة المصدرية ومجموعة البيانات على github.com/Edw2n/Lens.git.
كاميرات ذكية تواكب رؤية الذكاء الاصطناعي: تقنية Lens تأخذ التصوير إلى آفاق جديدة!
تقدم تقنية Lens الجديدة حلاً مبتكرًا لمشكلة فرق الوضوح في نماذج الرؤية الحاسوبية، مما يعزز دقة الأداء دون الحاجة للبيانات المميزة. تعرفوا على كيف تحدد Lens جودة الصور من منظور النموذج نفسه!
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
