انطلقت في عالم الموضة ثورة جديدة مع تطوير نموذج فاشن فلورنس، وهو نموذج يتكامل بين الرؤية واللغة (vision-language) تم تحسينه لمهام استخلاص السمات الهيكلية من صور الملابس. هذا النموذج يتيح للمستخدمين الحصول على معلومات دقيقة ومنظمة عبر توليد كائنات JSON تحدد الفئات والألوان والمواد وأنماط الملابس، كل ذلك بضغطة زر واحدة!
اعتمد فريق البحث على مجموعة بيانات iMaterialist Fashion التي تحتوي على 228 ملصقاً، حيث تم دمج التعليقات التفصيلية في هيكلٍ مدمج يتكون من 6 فئات و16 لوناً و19 نمطاً، باستخدام تقنيات هندسة الملصقات القائمة على القواعد. وتم تطبيق تقنية LoRA (Low-Rank Adaptation) على جميع طبقات فك الشيفرة، حيث تم تدريب النموذج على 3,688 مثالاً، ومن المدهش أنه حقق دقة تصل إلى 94.6% في الفئات و63.0% في المواد على مجموعة اختبار مكونة من 461 صورة.
واحدة من أهم ميزات فاشن فلورنس هي قدرته على إنتاج JSON صالح 99.8% من الوقت، مما يجعله مثالياً للاستخدام في أنظمة التوصية والاسترجاع اللاحقة. كما يعمل النموذج بكفاءة على وحدة معالجة رسومات واحدة دون تكاليف إضافية أثناء الاستعلام، مع تحقق F1 لإشارات الأنماط الذي بلغ 0.753.
تم نشر النموذج على منصة Hugging Face Space ودمجه بنجاح في نظام توصية الملابس المفتوح Loom، مما يفتح آفاقاً جديدة في مشروع تبسيط تجربة التسوق بالاعتماد على الذكاء الاصطناعي. يبدو أن مستقبل الموضة سيكون أكثر ذكاءً ودقة، فهل أنتم مستعدون لاستقباله؟
فاشن فلورنس: نموذج ثوري لاستخراج سمات الموضة من الصور بدقة متناهية!
يقدم نموذج فاشن فلورنس تقنية جديدة لاستخراج المعلومات الهيكلية من صور الملابس، مع تقديم دقة عالية في التعرف على السمات المختلفة. هذا التطور يقربنا خطوة نحو مستقبل أكثر ذكاءً في عالم الموضة.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
