في عالم الذكاء الاصطناعي، حيث تتطور التقنيات بشكل متسارع، يأتي نموذج ActiveSAM ليمثل قفزة نوعية في مجال تقسيم الصور. بعد النجاح الذي حققه نموذج Segment Anything Model 3 (SAM 3)، تم تصميم ActiveSAM لتحسين كفاءة تقسيم الصور عبر فهم المفاهيم المتعددة دون الحاجة إلى تدريب مسبق.
**كيف يعمل ActiveSAM؟**
يقوم ActiveSAM بتحويل SAM 3 إلى نظام تقسيم يعتمد على مفردات نشطة، حيث يقوم أولًا بتوحيد وتوسيع مطالب الفئات، ثم يقدّر مجموعة فئات نشطة عن طريق عرض منخفض الدقة للصورة. هذا يعني أننا نعمل على تخفيض الحسابات غير الضرورية من خلال استبعاد الفئات التي لا تنطبق على الصورة المعنية، مما يوفر الكثير من الوقت.
تستخدم المرحلة النهائية من النظام تقنيات التوازن الخلفي التي تساهم في تقليل تأثير البكسلات ذات الثقة المنخفضة. وبهذا الشكل، لا يحتاج ActiveSAM إلى تدريب على مجموعة بيانات معينة أو تحديثات للوزن، مما يجعله حلاً مثالياً للنطاقات عالية التكلفة مثل القيادة الذاتية والذكاء الاصطناعي المتعدد الأوجه.
أثبت ActiveSAM تفوقه في الأداء من خلال تحصيل نتائج أفضل من النموذج الرائد الحالي SegEarth-OV3 بحوالي 1.4 mIoU، بالإضافة إلى سرعته الكبيرة في معالجة البيانات التي تصل إلى 5.5 مرة أسرع في مجموعات البيانات الكبيرة.
هذه الابتكارات تفتح الأبواب لاستخدام ActiveSAM في حالات الاستخدام التي تعاني من ضوضاء في المدخلات، مما يشير إلى مدى مرونته وقدرته على التكيف مع تحديات العالم الحقيقي. للمزيد عن هذا النظام يمكنك زيارة كود المصدر هنا.
*ما رأيكم في هذا التطور؟ شاركونا في التعليقات!*
اكتشاف ActiveSAM: الحل الثوري لتقسيم الصور بثقة وسرعة دون تدريب!
يقدم ActiveSAM تقنية مبتكرة في تقسيم الصور دون الحاجة للتدريب، مما يحقق توازنًا مدهشًا بين السرعة والدقة. يتيح هذا النظام استخدام نماذج متقدمة بكفاءة حتى في البيئات المليئة بالضوضاء.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
