في عالم الذكاء الاصطناعي المتطور، أصبحت نماذج الانتشار (Diffusion Models) الخاصة بالفيديو محورية في توفير جودة عالية وفهم أعمق لمحتوى الفيديو. ومع تزايد طول الفيديوهات، تواجه هذه النماذج تحديات جسيمة نتيجة ظهور عنق زجاجة في الذاكرة بسبب تخزين الأجزاء المولدة سابقًا.

في دراسة جديدة، تم تصميم آلية مبتكرة تُعرف بتصحيح الانحياز في جداول الكاش الخاصة بالمفاتيح والقيم (KV cache) لتعزيز الجودة دون زيادة استخدام الذاكرة. وبدلاً من تقليل الجودة بشكل كبير كما هو شائع عند تقليل عرض bitwidth، تسعى هذه الدراسة إلى تقليل جودة الفيديو فقط بشكل طفيف، وذلك من خلال معالجة الانحياز الناتج عن الضوضاء في عملية الكوانتيزايشن (Quantization).

السبب وراء هذه الظاهرة يعود إلى ما يسمى بالانحياز الجنسن (Jensen bias)، حيث تؤدي الضوضاء الناتجة عن الكوانتيزايشن إلى زيادة مساهمة المفاتيح المخزنة في الكاش، مما يسرق الانتباه من الجزء الحالي غير الكوانتيزايشن. ولإزالة هذا الانحياز، تقدم الدراسة تصحيحًا يعتمد على حجم خطوات الكوانتيزايشن ونورما الطلبات (Query Norm) مما يؤدي إلى استعادة معظم الجودة المفقودة.

تم اختبار هذه الطريقة على نماذج مثل MAGI-1 وSkyReels-V2 وHY-WorldPlay، حيث أظهرت نتائج مذهلة من حيث جودة الفيديو والحفاظ على الذاكرة، حيث تمكنت من تفوق على تقنيات INT4 باستخدام ذاكرة أقل بنسبة 50%.

هذا الاكتشاف يعد خطوة كبيرة نحو تحسين تقنية الفيديو الآلي، ويُعَدُّ مثالاً ساطعًا على كيفية استخدام التفكير الابتكاري في مواجهة تحديات التكنولوجيا الحديثة. هل أنتم متحمسون لرؤية كيف ستؤثر هذه الحلول على صناعة الفيديو في المستقبل؟ شاركونا آرائكم في التعليقات!