في عصر الذكاء الاصطناعي، تبرز التقنيات المتطورة لتجربة ارتداء الملابس الافتراضية (Virtual Try-On) كواحدة من أهم الابتكارات، ولكن تبقى مشكلة تقييم هذه التقنيات عقبة كبيرة. من هنا، تأتينا OpenVTON-Bench كحل مبتكر من خلال تقديم معيار ضخم يتضمن حوالى 100,000 زوج من الصور عالية الدقة (حتى $1536 imes 1536$).
تعتبر OpenVTON-Bench نتاج أحدث ما توصلت إليه نماذج الانتشار (Diffusion Models)، حيث تقدم معدل تقييم موثوق يُعنى بالتفاصيل الدقيقة والاتساق الدلالي لارتداء الملابس. يعتمد هذا المعيار على تجميع هيراركي مستند إلى DINOv3 لعينة متوازنة دلاليًا، بالإضافة إلى استخدام ميزة التسمية الكثيفة المدعومة من جمني (Gemini)، لضمان توزيع موحد على 20 فئة دقيقة من الملابس.
لتقديم تقييم موثوق، يقترح OpenVTON-Bench بروتوكولًا متعدد الأبعاد يقيس جودة تجربة ارتداء الملابس الافتراضية عبر خمسة أبعاد قابلة للتفسير: اتساق الخلفية، وفاء الهوية، ووفاء النسيج، وواقعية الشكل، والواقعية العامة. يجمع البروتوكول بين التفكير الدلالي القائم على نموذج اللغات (VLM) مع مقياس تمثيل متعدد المقاييس يعتمد على تقسيم SAM3 وإزاحة الشكل، مما يوفر قدرة على فصل أخطاء محاذاة الحواف عن العيوب الداخلية في الأنسجة.
تظهر النتائج التجريبية توافقًا قويًا مع أحكام البشر، حيث بلغت قيمة Kendall's τ 0.833 مقابل 0.611 لمؤشر SSIM، مما يُؤكد على قوة هذا المعيار في تقييم تقنيات تجربة ارتداء الملابس الافتراضية. يُظهر OpenVTON-Bench كيف يمكن للابتكار والعلوم أن يتآزرا لإنتاج أدوات رائعة وموثوقة في السوق التجارية.
OpenVTON-Bench: قفزة نوعية في تقييم تجربة ارتداء الملابس الافتراضية!
تمثل OpenVTON-Bench معيارًا جديدًا لتقييم تقنيات تجربة الملابس الافتراضية، حيث تحتوي على نحو 100 ألف زوج من الصور عالية الدقة. يوفر هذا المعيار أدوات متطورة لتقييم الجودة بتفاصيل دقيقة وموضوعية.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
