في عالم اليوم، تعتمد [أنظمة](/tag/أنظمة) [الرؤية](/tag/الرؤية) الذكية على [الذكاء الاصطناعي](/tag/الذكاء-الاصطناعي) ([Artificial Intelligence](/tag/artificial-intelligence)) بشكل متزايد لتحسين معالجة تدفقات الفيديو. ومع ذلك، فإن الاعتماد على [الحوسبة السحابية](/tag/[الحوسبة](/tag/الحوسبة)-السحابية) ([Cloud Computing](/tag/cloud-computing)) قد لا يكون عمليًا بسبب [قيود](/tag/قيود) عرض النطاق الترددي (Bandwidth) والخصوصية. في هذا السياق، تظهر الحاجة إلى [تطوير](/tag/تطوير) [تقنيات جديدة](/tag/[تقنيات](/tag/تقنيات)-جديدة) تتناسب مع إمكانيات الوحدات الميكروية ذات [الطاقة](/tag/الطاقة) المنخفضة (Ultra-low-power microcontrollers) التي غالبًا ما تُستخدم في هذه الأنظمة.

هنا تأتي [تقنية](/tag/تقنية) MR2-ByteTrack، وهي طريقة حديثة لكشف الفيديو (Video [Object Detection](/tag/object-detection)) تُعتبر الأمثل للوحدات المدمجة. تعتمد MR2-ByteTrack على [استراتيجيات ذكية](/tag/[استراتيجيات](/tag/استراتيجيات)-ذكية) تجمع بين التقدير العالي والمنخفض الدقة، مما يمكنها من تقليل [تكاليف](/tag/تكاليف) [الحساب](/tag/الحساب). تستخدم هذه [التقنية](/tag/التقنية) أسلوب "ByteTrack" لتربط بين التحليلات [عبر](/tag/عبر) الإطارات وتصحيح [الأخطاء](/tag/الأخطاء) من خلال [خوارزمية](/tag/خوارزمية) "Rescore" التي تجمع بين درجات [الثقة](/tag/الثقة) [عبر](/tag/عبر) الأطر.

تم تطبيق MR2-ByteTrack على كل من [نموذج](/tag/نموذج) مستند إلى [الشبكات العصبية](/tag/[الشبكات](/tag/الشبكات)-العصبية) التلافيفية ([CNN](/tag/cnn)) ونموذج يعتمد على [المحولات](/tag/المحولات) ([Transformer](/tag/transformer))، مما يظهر مرونتها [عبر](/tag/عبر) الهياكل المختلفة. أجريت [تجارب](/tag/تجارب) على [مجموعات بيانات](/tag/مجموعات-[بيانات](/tag/بيانات)) "ImageNetVID"، حيث أظهرت [التقنية](/tag/التقنية) [دقة](/tag/دقة) ملحوظة مع [تحقيق](/tag/تحقيق) درجات (mAP) تصل إلى 49.0 بالنسبة لنماذج ([CNN](/tag/cnn)) و48.7 بالنسبة لنموذج ([Transformer](/tag/transformer))، مع تقليل عمليات الجمع المتكررة حتى 55% لنماذج ([CNN](/tag/cnn)) و32% لنموذج ([Transformer](/tag/transformer)).

عندما تم [تنفيذ](/tag/تنفيذ) هذه [التقنية](/tag/التقنية) على شريحة "GAP9"، وهي شريحة متعددة النواة تعتمد على [معمارية](/tag/معمارية) RISC-V، أوضحت MR2-ByteTrack توفيرًا للطاقة يصل إلى 55% مقارنة بمعالجة [الصور](/tag/الصور) بدقة كاملة. وهكذا، تتيح هذه الطريقة الكشف في الوقت الحقيقي باستخدام [نموذج](/tag/نموذج) ([Transformer](/tag/transformer)) على وحدة [رؤية](/tag/رؤية) مدمجة، مما يمهد الطريق لمزيد من [الابتكارات](/tag/الابتكارات) في [العالم الرقمي](/tag/العالم-الرقمي).