تمثل نماذج انتشار الفيديو (Video Diffusion Models - VDMs) تحديًا كبيرًا بسبب التكاليف الحسابية الضخمة المرتبطة بها. وعلى الرغم من جهود تحسين الأداء عبر طرق الكاليبراشن السابقة، إلا أن تلك الطرق كانت تعاني من قيود كبيرة مثل اعتمادها على بيانات الكاليبراشن، وفترات الكاليبراشن الطويلة، واحتمالية تغيير التوزيع.

لكن، ماذا لو كان هناك طريق آخر؟ هذا هو ما قدمته تقنية NaviCache، التي تعيد صياغة مفهوم الكاليبراشن الذاتي باستخدام أساليب مبتكرة مثل الإرشاد الذاتي عند الوقت (Test-Time Self-Calibration). تستفيد NaviCache من مفهوم نظام الملاحة القائم على القصور الذاتي (Inertial Navigation System - INS) لربط الاختلافات بين المدخلات والمخرجات.

تعتمد تلك التقنية على بنية ثنائية الحالة تقوم بتتبع نسبة تغير الميزات بدقة، مما يمكّنها من التخلص من التكاليف الحسابية المبالغ فيها. بالإضافة إلى ذلك، يتم دمج جدول زمني للضوضاء يعتمد على الوقت مع آلية تحديث للقياسات الواعيات بالشك، مما يؤدي إلى تنفيذ حسابات مضبوطة.

لقد أثبتت التجارب على مجموعة بيانات HunyuanVideo وWan وOpen-Sora أن NaviCache توفر أداءً شاملاً ممتازًا مع دقة كبيرة في تقييم الأخطاء، مما يجعلها نقطة تحول لأبحاث نماذج الفيديو.