في إطار جهود تحسين المراقبة الحضرية وتقييم الكوارث، يعد اكتشاف التغييرات ثلاثية الأبعاد من الصور متعددة الزوايا أحد المجالات الحيوية. ومع ذلك، تواجه الأساليب التقليدية تحديات عديدة بسبب اعتمادها على المجال الثنائي الأبعاد، حيث يتم الخلط بين اختلافات زاوية الرؤية والتغيرات الفعلية. هنا يأتي دور نموذج VGGT-CD، الذي يقدم حلاً مبتكرًا من دون الحاجة إلى تدريب مسبق، مما يجعله خطوة ثورية في هذا المجال.

تسعى النماذج الهندسية البصرية، مثل VGGT، إلى إنتاج سحب نقاط كثيفة بسرعة من الصور غير المتوضعة. لكن، كانت هناك مشكلات أساسية تعيق مهمة إعادة البناء من فترات زمنية مختلفة: غموض المقياس غير المتوقع، ومعضلة تغير التسجيل حيث يتم إفساد المحاذاة بسبب التغيرات في المشهد، بالإضافة إلى الضجيج المزعج الذي يؤثر على النتائج.

يتمتع نموذج VGGT-CD بنهج مبتكر يتكون من مرحلتين: المرحلة الأولية (Coarse Stage) التي تعتمد على استدلال مشترك لإطارات مفتاحية محدودة، مما يساهم في إنشاء فضاء قياسي موحد، والمرحلة المتقدمة (Fine Stage) التي تركز على تنقية إعادة البناء الكثيفة عبر عزل التوافقات ذات الخلفيات الثابتة.

ومن خلال تقنية متقدمة، يتم تحسين المحاذاة باستخدام المتجهات الحسابية والتي تضمن عدم الانخفاض في جودة النتائج. ومن خلال اختبارات معيارية على 11 مشهداً من مجموعة بيانات World Across Time، أثبت VGGT-CD فعاليته من خلال تقليل خطأ المسار المطلق بمعدل 44% في البيئات الخارجية و59% في البيئات الداخلية. كما أن هذه التقنية تكمل عملية التسجيل بشكل أسرع بست مرات، مما ينتج عنه خرائط التغير ثلاثية الأبعاد عالية النقاء دون الحاجة إلى تدريب مخصص.

إن VGGT-CD ليس فقط اختراقًا تقنيًا، بل يعيد تعريف كيفية التعامل مع البيانات ثلاثية الأبعاد، مما يفتح الباب أمام تطبيقات جديدة في مجالات متعددة.