في عالم اليوم، تعتمد [أنظمة](/tag/أنظمة) [الرؤية](/tag/الرؤية) الذكية على [الذكاء الاصطناعي](/tag/الذكاء-الاصطناعي) ([Artificial Intelligence](/tag/artificial-intelligence)) بشكل متزايد لتحسين معالجة تدفقات الفيديو. ومع ذلك، فإن الاعتماد على [الحوسبة السحابية](/tag/[الحوسبة](/tag/الحوسبة)-السحابية) ([Cloud Computing](/tag/cloud-computing)) قد لا يكون عمليًا بسبب [قيود](/tag/قيود) عرض النطاق الترددي (Bandwidth) والخصوصية. في هذا السياق، تظهر الحاجة إلى [تطوير](/tag/تطوير) [تقنيات جديدة](/tag/[تقنيات](/tag/تقنيات)-جديدة) تتناسب مع إمكانيات الوحدات الميكروية ذات [الطاقة](/tag/الطاقة) المنخفضة (Ultra-low-power microcontrollers) التي غالبًا ما تُستخدم في هذه الأنظمة.
هنا تأتي [تقنية](/tag/تقنية) MR2-ByteTrack، وهي طريقة حديثة لكشف الفيديو (Video [Object Detection](/tag/object-detection)) تُعتبر الأمثل للوحدات المدمجة. تعتمد MR2-ByteTrack على [استراتيجيات ذكية](/tag/[استراتيجيات](/tag/استراتيجيات)-ذكية) تجمع بين التقدير العالي والمنخفض الدقة، مما يمكنها من تقليل [تكاليف](/tag/تكاليف) [الحساب](/tag/الحساب). تستخدم هذه [التقنية](/tag/التقنية) أسلوب "ByteTrack" لتربط بين التحليلات [عبر](/tag/عبر) الإطارات وتصحيح [الأخطاء](/tag/الأخطاء) من خلال [خوارزمية](/tag/خوارزمية) "Rescore" التي تجمع بين درجات [الثقة](/tag/الثقة) [عبر](/tag/عبر) الأطر.
تم تطبيق MR2-ByteTrack على كل من [نموذج](/tag/نموذج) مستند إلى [الشبكات العصبية](/tag/[الشبكات](/tag/الشبكات)-العصبية) التلافيفية ([CNN](/tag/cnn)) ونموذج يعتمد على [المحولات](/tag/المحولات) ([Transformer](/tag/transformer))، مما يظهر مرونتها [عبر](/tag/عبر) الهياكل المختلفة. أجريت [تجارب](/tag/تجارب) على [مجموعات بيانات](/tag/مجموعات-[بيانات](/tag/بيانات)) "ImageNetVID"، حيث أظهرت [التقنية](/tag/التقنية) [دقة](/tag/دقة) ملحوظة مع [تحقيق](/tag/تحقيق) درجات (mAP) تصل إلى 49.0 بالنسبة لنماذج ([CNN](/tag/cnn)) و48.7 بالنسبة لنموذج ([Transformer](/tag/transformer))، مع تقليل عمليات الجمع المتكررة حتى 55% لنماذج ([CNN](/tag/cnn)) و32% لنموذج ([Transformer](/tag/transformer)).
عندما تم [تنفيذ](/tag/تنفيذ) هذه [التقنية](/tag/التقنية) على شريحة "GAP9"، وهي شريحة متعددة النواة تعتمد على [معمارية](/tag/معمارية) RISC-V، أوضحت MR2-ByteTrack توفيرًا للطاقة يصل إلى 55% مقارنة بمعالجة [الصور](/tag/الصور) بدقة كاملة. وهكذا، تتيح هذه الطريقة الكشف في الوقت الحقيقي باستخدام [نموذج](/tag/نموذج) ([Transformer](/tag/transformer)) على وحدة [رؤية](/tag/رؤية) مدمجة، مما يمهد الطريق لمزيد من [الابتكارات](/tag/الابتكارات) في [العالم الرقمي](/tag/العالم-الرقمي).
اكتشاف الفيديو بذكاء: تقنية MR2-ByteTrack تعيد تعريف الحدود في معالجات الرؤية المدمجة
تقنية MR2-ByteTrack تقدم حلاً مبتكرًا لمشكلة الكشف عن الأجسام في الفيديو باستخدام أجهزة استشعار رؤية ذكية. بفضل القدرة على تقليل استهلاك الطاقة، تسهم هذه التقنية في تحقيق الكشف في الوقت الحقيقي دون المساس بالدقة.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
