تُعتبر القدرة على التقاط هيكل المشهد الزماني المكاني في الأبعاد الأربعة (4D) من الأمور الأساسية لضمان التشغيل الآمن والموثوق للروبوتات في البيئات الديناميكية. ومع ذلك، تعالج الأساليب الحالية جزءًا فقط من المشكلة، حيث تقدم إما تتبعًا هندسيًا خشنًا عبر الصناديق المحيطية أو تقديرات احتلال ثلاثية الأبعاد (3D) تفصيلية تفتقر إلى ربط زمني صريح وفهم للمستويات الفردية.

في هذا العمل، نقدم تقنية Gaussian Splatting المخبأة (Latent Gaussian Splatting) لتتبع المساحات الشاملة في الأبعاد الأربعة (4D-POT). نقوم بإعادة النظر في التمثيل الأساسي ونموذج ميزات ثلاثية الأبعاد كمجموعة رقيقة من الغاوسيانات الحاملة للميزات. تعمل هذه كنقاط رئيسية ديناميكية موجهة نحو الحجم، مما يمكّن من التجميع المتواصل المكاني والمعتمد على المسافة للميزات من زوايا متعددة قبل تحويلها إلى شبكة Voxels من أجل فك الشيفرة.

تتيح هذه الصيغة المركزية للنقاط مجالات استقبالية مرنة تعتمد على البيانات وتفاعلات مكانية طويلة المدى يصعب التقاطها باستخدام أدوات محلية وكثيفة تعتمد على الشبكات. كما يعزز تمثيل غاوسيهراركي تفكيرًا متعدد المقاييس من خلال دمج السياق العالمي من نقاط رئيسية خشنه مع التفاصيل الدقيقة من تدفقات عالية الدقة.

أظهرت التجارب الواسعة على مجموعات بيانات Occ3D وnuScenes وWaymo أداءً رائدًا في مجال 4D-POT. يمكن العثور على الكود والنماذج في هذا الرابط [الرابط الخاص].