في عالم الذكاء الاصطناعي، يستمر البحث العلمي في إثارة الدهشة مع ظهور أساليب وتقنيات جديدة تغير الطريقة التي نتفاعل بها مع الصور. أحدث هذه الاكتشافات هو مفهوم تقسيم الصور تحت الدلالي (Sub-Semantic Image Segmentation)، والذي يمثل نقطة التقاء بين تقسيم المظاهر (texture segmentation) وتقسيم الكائنات (semantic segmentation).
ما هو تقسيم الصور تحت الدلالي؟
يتميز هذا النمط الجديد بعدم اعتماده على تسميات الأشياء بشكل كامل، بل يسمح بتقسيم الصورة إلى أنماط مظهريّة مستقرة يمكن وصفها بلغة مفهومة. لتحقيق ذلك، تم دمج نموذج رؤيّة/لغة شامل مع نموذج SAM 3، وهو نموذج يعطي أفقًا جديدًا في تقسيم الصور عن طريق استخدام وصفات نصية غنية يقوم بترجمتها إلى أقنعة.
تميّز الورقة البحثية التي تتناول هذا الموضوع بتحديد التحديات الرئيسية التي تواجه تقنيات الربط البسيط بين النموذجين. وعقب ذلك، تم طرح نموذج DETECTURE الذي يتمكن من تجاوز ثلاثة أنواع من العقبات الأساسية: تسرب اللغة بين المناطق المختلفة، التنافس على وجود نماذج داخل تقنيات التقسيم، والتشويش الدلالي عند الربط بين اللغة والأقنعة.
ولأن الفئة الجديدة لم يكن لديها مجموعة بيانات خاصة بها، فقد أقدمت الدراسة على تقديم مجموعة بيانات جديدة تُدعى TextureADE، وهي قائمة مستمدة من مجموعة بيانات ADE20K. ولإثبات فعالية نموذج DETECTURE، تمت المقارنة مع عدة نماذج أخرى، حيث أظهرت النتائج تفوقه في دقة الأداء على مجموعة كبيرة من البيانات.
لرؤية التفاصيل التقنية والكود المستخدم، يُمكنكم زيارة رابط الكود.
إن هذا الابتكار في تجربة تقسيم الصور قد يفتح آفاقًا جديدة في مجالات متعددة، بدءًا من الرؤية الحاسوبية إلى التطبيقات في المركبات الذاتية القيادة. هل تعتقد أن هذه التقنية ستغير كيفية عملنا مع الصور؟ شاركونا آراءكم في التعليقات!
إبداع جديد في تقنيات تقسيم الصور: اكتشاف فئة جديدة تدعى تقسيم الصور تحت الدلالي
تمتاز فئة تقسيم الصور تحت الدلالي (Sub-Semantic Image Segmentation) بتجاوز الحدود بين تقسيم الكائنات والنماذج البصرية. بفضل نموذجنا الجديد DETECTURE، يمكن تقسيم الصور بناءً على أنماط مظهريّة مستقرة، مما يعزز الدقة والفاعلية في تحليل الصور.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
