في عالم الذكاء الاصطناعي، حيث تتطور التقنيات بشكل متسارع، يأتي نموذج ActiveSAM ليمثل قفزة نوعية في مجال تقسيم الصور. بعد النجاح الذي حققه نموذج Segment Anything Model 3 (SAM 3)، تم تصميم ActiveSAM لتحسين كفاءة تقسيم الصور عبر فهم المفاهيم المتعددة دون الحاجة إلى تدريب مسبق.

**كيف يعمل ActiveSAM؟**
يقوم ActiveSAM بتحويل SAM 3 إلى نظام تقسيم يعتمد على مفردات نشطة، حيث يقوم أولًا بتوحيد وتوسيع مطالب الفئات، ثم يقدّر مجموعة فئات نشطة عن طريق عرض منخفض الدقة للصورة. هذا يعني أننا نعمل على تخفيض الحسابات غير الضرورية من خلال استبعاد الفئات التي لا تنطبق على الصورة المعنية، مما يوفر الكثير من الوقت.

تستخدم المرحلة النهائية من النظام تقنيات التوازن الخلفي التي تساهم في تقليل تأثير البكسلات ذات الثقة المنخفضة. وبهذا الشكل، لا يحتاج ActiveSAM إلى تدريب على مجموعة بيانات معينة أو تحديثات للوزن، مما يجعله حلاً مثالياً للنطاقات عالية التكلفة مثل القيادة الذاتية والذكاء الاصطناعي المتعدد الأوجه.

أثبت ActiveSAM تفوقه في الأداء من خلال تحصيل نتائج أفضل من النموذج الرائد الحالي SegEarth-OV3 بحوالي 1.4 mIoU، بالإضافة إلى سرعته الكبيرة في معالجة البيانات التي تصل إلى 5.5 مرة أسرع في مجموعات البيانات الكبيرة.

هذه الابتكارات تفتح الأبواب لاستخدام ActiveSAM في حالات الاستخدام التي تعاني من ضوضاء في المدخلات، مما يشير إلى مدى مرونته وقدرته على التكيف مع تحديات العالم الحقيقي. للمزيد عن هذا النظام يمكنك زيارة كود المصدر هنا.

*ما رأيكم في هذا التطور؟ شاركونا في التعليقات!*