تعد الصور متعددة الزوايا من الأقمار الصناعية أداة حيوية في عصر كواكب الأقمار الصناعية، حيث تلعب دورًا أساسيًا في مراقبة الأرض (Earth Observation) وإعادة بناء نماذج السطح الرقمية (Digital Surface Model) بدقة عالية. على الرغم من التحولات الكبيرة التي أحدثتها نماذج الأسس الثلاثية الأبعاد (3D foundation models) في رؤية الكمبيوتر، إلا أن استخدامها في استشعار الأرض يعاني من قيود هيكلية ناتجة عن التباين بين الافتراضات الضمنية للمنظور والهندسة الفعلية لنموذج الدفع المداري.

في هذا السياق، يبرز إطار EO-VGGT كحل مبتكر، حيث يقوم بتكييف نموذج قائم على منظور محدد مسبقًا لمراعاة الملاحظات المدارية من خلال دمج الجيوميتري الفعلية. يبدأ هذا الإطار بتطبيق استراتيجية GCCS (اختيار مقيد بواسطة تباين الهندسة) التي تقوم بتصفية المشاهد غير المثلى من خلال تحقيق التوازن بين التنوع الهندسي والتناسق الإشعاعي، مما يُحسن تسلسل المدخلات.

بعد ذلك، يقوم مُشفّر أشعة جهاز الاستشعار (Sensor-Ray Encoder) بتهيئة خطوط رؤية بكسلية من نموذج الوظيفة المنطقية (Rational Function Model) إلى رموز هندسية في الفضاء عالي الأبعاد، مما يتيح السعي لاستكشاف التباين الرياضي بين الإسقاط المركزي والديناميات المدارية. أخيرًا، يُستخدم مُعدل حساس للأشعة (Ray-Pointing-Aware Adapter) المتضمن في نموذج خفيف الوزن، الذي يدمج هذه الرموز مباشرة في الهيكل العظمي للنموذج القائم على التحويل.

تُظهر نتائجنا أن دمج الجيوميتري الفعلية مع اختيار مشاهد محسن هو أمر حاسم لضمان إعادة بناء ثلاثية الأبعاد موثوقة للأقمار الصناعية. يمثل EO-VGGT خطوة هامة نحو تعزيز دقة استشعار الأرض، مما سيفتح الأبواب أمام مزيد من الابتكارات في هذا المجال.