لقد شهدت نماذج الانتشار (Diffusion Models) نجاحًا باهرًا في مجال توليد وتحرير الصور والفيديوهات. وعلى الرغم من أن الدراسات الأخيرة قد توسعت في هذا المجال لتحرير الحركة، إلا أن تحويل الحركة والموقع بشكل متزامن - رغم أهميته العملية - لا يزال مجهولًا إلى حد كبير. لفهم كيفية تحقيق تحرير الحركة والموقع بشكل موثوق، قمنا أولاً بتحليل العوامل الأساسية التي تؤثر سلبًا على جودته.
استنادًا إلى هذا التحليل، نقترح تقنية TeleMorpher، التي تعد واحدة من أولى المنصات لتحرير الحركة والموقع بالتزامن. تعتمد تقنيتنا على استغلال الأولويات الحركية، والتي تستند إلى فيديو مركّز حول الحركة ينتج عن نموذج جاهز ليكون بمثابة دليل على تحرير الحركة، بالإضافة إلى الحركة الحقيقية، مما يتيح تحرير الحركة والموقع بشكل أكثر دقة وسهولة.
تعمل منصتنا كالتالي:
1. نقوم أولاً بفصل الشخصية الرئيسية عن الخلفية باستخدام نماذج تقسيم ومعالجة مسبقة.
2. ثم نقدم تحريف التماثيل بدون تدريب، حيث يتم تعديل حركة الشخصية الرئيسية باستخدام الأولوية الحركية كدليل.
3. يتم حقن نتيجة فيديو الحركة المحور مباشرة في محرر الحركة الأساسي خلال مرحلة الاستدلال، مما يقلل من الفجوة بين الحركات المصدر والهدف مع الحفاظ على مظهر الفيديو الأصلي.
4. لتعزيز موثوقية التقييمات الكمية، نقدم مقياسين جديدين مستندين إلى LPIPS يقيسان تناسق الخلفية قبل وبعد تحرير الحركة وموثوقية أداء تحرير الحركة عبر قياس الفرق بين هياكل الشخصيات المستخرجة من الفيديوهات المصدر والهدف.
تجاربنا باستخدام فيديوهات حقيقية ومجموعة بيانات TaiChi تظهر أن TeleMorpher تحقق أداءً متفوقًا في كل من القياسات الكمية والنوعية، مما يبرز فعاليتها.
TeleMorpher: ثورة في تحرير الحركة والموقع بشكل متزامن!
تقدم تقنية TeleMorpher فهماً جديداً لتحرير الحركة والموقع بطرق لم تكن مستكشفة من قبل، مما يحقق نتائج مذهلة في تحسين جودة النتائج. تعالوا نتعرف على كيفية عمل هذه التقنية الثورية!
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
