أصبحت تقنيات توليد الفيديو التلقائي (Autoregressive Video Generation) لها مستقبل واعد، إلا أن التحديات العملية تقف عائقًا أمام تطورها، حيث يتطلب التنفيذ الفعلي موارد حسابية ضخمة بسبب العملية المتكررة لإزالة الضوضاء. ولكن، ماذا لو كان هناك طريقة لتخفيف العبء وجعل هذه العملية أكثر كفاءة؟ هنا تدخل تقنية MotionCache.

تستفيد هذه التقنية من استراتيجيات إعادة استخدام الذاكرة لتسريع عملية生成 الفيديو عن طريق تخطي خطوات إزالة الضوضاء غير الضرورية، لكن الطرق التقليدية غالبًا ما تعتمد على تخطي مستوى القطع الكبير، مما يؤدي إلى عدم الالتفات لمتطلبات الحركة الدقيقة للبكسلات.

ما يجعل MotionCache مميزًا هو ربطها بين الأخطاء الناتجة عن الذاكرة وعدم استقرار المتبقي من البكسلات. وذلك من خلال استغلال الفروق بين الإطارات كوسيلة مرنة لفهم الخصائص الحركية على مستوى البكسل. يعتمد نظام MotionCache على استراتيجية من粗到细، حيث يبدأ بمرحلة دافئة تثبت التماسك الدلالي، تليها إعادة استخدام الذاكرة الموزونة حركيًا، مما يسمح بضبط تكرار التحديثات ديناميكيًا لكل رمز.

أظهرت تجارب واسعة على نماذج متطورة مثل SkyReels-V2 وMAGI-1 أن MotionCache تمكنت من تحقيق تسريع كبير بنسبة تصل إلى 6.28 مرة و1.64 مرة على التوالي، مع الحفاظ الفعّال على جودة توليد الفيديو (انخفاض بنسبة 1% و0.01% على الترتيب في VBench).

يمكنكم الاطلاع على الشيفرة المصدرية لهذه التقنية المبتكرة عبر زيارة [رابط الشيفرة]. فهل تعتقد أن هذه الطريقة ستحدث ثورة في عالم توليد الفيديو؟ شاركونا آراءكم في التعليقات!