في عصر يتسارع فيه تطور تقنيات رصد الكائنات، تبرز حلول الكاشفات أحادية المرحلة (Single Stage Detectors) كالأفضل في مجال الإدراك البصري اللحظي. ومع ذلك، فإن نسبة كبيرة من العبء الحسابي في هذه النماذج تأتي من المراحل الأساسية العميقة، حيث تتجمع وحدات C2f التي تعاني من اختناق عند مستويات عالية من الضرب، مما يؤدي إلى زيادة كبيرة في عدد المعاملات بسبب التوسع التربيعي مع عرض القناة.

هنا يأتي الابتكار مع QYOLO، الإطار المستوحى من الذكاء الكمي الذي يحقق ضغطاً بنائياً حقيقياً. يتم ذلك من خلال استبدال اثنتين من أعمق وحدات C2f في المراحل P4/16 (512 قناة) وP5/32 (1024 قناة) بكتلة QMixBlock المدمجة. تقوم هذه الكتلة بإعادة ضبط القنوات العالمية عبر آلية خلط جيبية، مستخدمة معاملات مشتركة قابلة للتعلم بين كلا المرحلتين، مما يضمن أهمية متسقة للقنوات دون الحاجة إلى مجموعات معاملات مستقلة لكل مرحلة.

تظل عنق النموذج ورأس الكشف كلاسيكية وغير متغيرة. مع تقييمة على معيار VisDrone2019، أثبت QYOLOv8n أنه قادر على تقليل عدد المعاملات بنسبة 20.2% (من 3.01 مليون إلى 2.40 مليون) وتقليل 12.3% في GFLOPs مع تدهور طفيف بنسبة 0.4 نقطة في المقياس الموزون المتوسط. بينما حقق QYOLOv8s تخفيضاً بنسبة 21.8% مع تدهور قدره 0.1 نقطة. وعند دمجه مع عملية تقطير المعرفة، تم استعادة دقة الأداء الكاملة دون أية تكلفة إضافية على الضغط.

في المقابل، حقق تصميم موسع للعناصر الأساسية مع الرقبة تخفيضاً من 38 إلى 41% مع تكلفة أكبر في دقة الأداء، مما يؤكد أهمية التصميم النهائي القائم على العناصر الأساسية فقط.