في عالم الفن الرقمي، يعتبر توليد الفيديو فناً يتطلب تحكماً دقيقاً في أحداث الحركة وتصويرها، أي حركة الممثل ومسار الكاميرا. هنا تأتي تقنية ActCam الجديدة لتحدث ثورة في هذا المجال.

تقدم ActCam، الطريقة الخالية من التدريب (Zero-Shot) لتوليد الفيديو، والتي تتيح نقل حركة الشخصيات من فيديو إلى مشهد جديد، وتمكن المستخدم من التحكم في معلمات الكاميرا بشكل دقيق لكل إطار. تعتمد ActCam على نماذج نشر الصور إلى الفيديو المدربة مسبقًا والتي تقبل العمق المشهدي ووضع الشخصية كمدخلات.

عند توفير فيديو مصدر مع شخصية متحركة وحركة كاميرا مستهدفة، تقوم ActCam بتوليد أوضاع عميقة تبقى متسقة هندسياً عبر الإطارات. تشغل تقنية ActCam عملية عينة واحدة مع جدول تحكم ذو مرحلتين: حيث إن الخطوات الأولى تُركّز على كل من الوضع والعمق الفرعي للحفاظ على بنية المشهد، وبعد ذلك يُترك العمق وتركز التوجيه على الأوضاع فقط لتحسين التفاصيل ذات التردد العالي دون قيود زائدة على عملية التوليد.

لقد قمنا بتقييم ActCam على مجموعة واسعة من المعايير التي تشمل حركات شخصيات متنوعة وتغيرات في وجهات النظر تتسم بالصعوبة. وقد أثبتت نتائجنا أن ActCam تُحسن من التمسك بالكاميرا وصدق الحركة مقارنةً بالطريقة الخاصة بالوضع فقط وغيرها من طرق الوضع والكاميرا. أثبت المستخدمون تفضيلهم لهذه التقنية، خصوصًا مع التغيرات الكبيرة في وجهات النظر.

تظهر نتائج هذه الدراسة أن التحكم الدقيق والمتوافق مع الكاميرا وخطط الإرشاد المدروسة يمكن أن يتيح تحكمًا قويًا مشتركًا بين الكاميرا والحركة، وكل ذلك دون الحاجة إلى تدريب مسبق. للمزيد من التفاصيل، يمكنكم زيارة [الصفحة الرسمية للمشروع](https://elkhomar.github.io/actcam/).