في عالم متزايد التعقيد، يظهر تطور ملحوظ في القدرة على اكتشاف الأجسام باستخدام تقنيات RGB-T التي تجمع بين قوة كل من الأنماط المرئية والتصوير الحراري. ومع ذلك، كانت التطورات السابقة تعتمد على بنى تحتية ثقيلة للتعامل مع تداخل البيانات مما أدى إلى ارتفاع التكاليف الحاسوبية. من هنا، جاءت الملاحظات الحديثة التي تتبعت أن معظم مناطق الصورة تتكون من خلفيات هادئة، مثل السماء أو الأرض، والتي يمكن معالجتها بواسطة نماذج بسيطة.

استنادًا إلى هذا الاستنتاج، تم تقديم آلية دمج جديدة تركز على الكفاءة. وتشمل هذه الآلية مسح سريع للصورة لتحديد الاقتراحات التي تتطلب مزيدًا من الفحص، متبوعة بمرحلة دقيقة لتصفية الخيارات الإضافية عبر دمج الميزات.

النظام المقترح يقوم بتطبيق هذه العملية على مرحلتين: 1) مرحلة اكتشاف خفيفة ومتخصصة تُنتج مناطق اهتمام عالية الاستدعاء، 2) مرحلة فحص وتعزيز مدفوعة بالدمج لتحسين نتائج الكشف.

هذا التصميم يتيح للمنظومة توزيع الموارد الحاسوبية بشكل ديناميكي على المناطق الواعدة، مما يعزز من نجاح الاكتشاف مع الحفاظ على الكفاءة وتكاليف أقل. وتجارب واسعة أظهرت أن هذه الطريقة تحقق أداءً تنافسيًا مع عدد أقل من المعلمات وتكاليف أقل، بينما تبقى قادرة على التوسع مع الصور عالية الدقة.