في عالم اليوم، تعتمد أنظمة الرؤية الذكية على الذكاء الاصطناعي (Artificial Intelligence) بشكل متزايد لتحسين معالجة تدفقات الفيديو. ومع ذلك، فإن الاعتماد على الحوسبة السحابية (Cloud Computing) قد لا يكون عمليًا بسبب قيود عرض النطاق الترددي (Bandwidth) والخصوصية. في هذا السياق، تظهر الحاجة إلى تطوير تقنيات جديدة تتناسب مع إمكانيات الوحدات الميكروية ذات الطاقة المنخفضة (Ultra-low-power microcontrollers) التي غالبًا ما تُستخدم في هذه الأنظمة.

هنا تأتي تقنية MR2-ByteTrack، وهي طريقة حديثة لكشف الفيديو (Video Object Detection) تُعتبر الأمثل للوحدات المدمجة. تعتمد MR2-ByteTrack على استراتيجيات ذكية تجمع بين التقدير العالي والمنخفض الدقة، مما يمكنها من تقليل تكاليف الحساب. تستخدم هذه التقنية أسلوب "ByteTrack" لتربط بين التحليلات عبر الإطارات وتصحيح الأخطاء من خلال خوارزمية "Rescore" التي تجمع بين درجات الثقة عبر الأطر.

تم تطبيق MR2-ByteTrack على كل من نموذج مستند إلى الشبكات العصبية التلافيفية (CNN) ونموذج يعتمد على المحولات (Transformer)، مما يظهر مرونتها عبر الهياكل المختلفة. أجريت تجارب على مجموعات بيانات "ImageNetVID"، حيث أظهرت التقنية دقة ملحوظة مع تحقيق درجات (mAP) تصل إلى 49.0 بالنسبة لنماذج (CNN) و48.7 بالنسبة لنموذج (Transformer)، مع تقليل عمليات الجمع المتكررة حتى 55% لنماذج (CNN) و32% لنموذج (Transformer).

عندما تم تنفيذ هذه التقنية على شريحة "GAP9"، وهي شريحة متعددة النواة تعتمد على معمارية RISC-V، أوضحت MR2-ByteTrack توفيرًا للطاقة يصل إلى 55% مقارنة بمعالجة الصور بدقة كاملة. وهكذا، تتيح هذه الطريقة الكشف في الوقت الحقيقي باستخدام نموذج (Transformer) على وحدة رؤية مدمجة، مما يمهد الطريق لمزيد من الابتكارات في العالم الرقمي.