في عالم الذكاء الاصطناعي، يعتبر تناسق [نماذج الفيديو](/tag/[نماذج](/tag/نماذج)-[الفيديو](/tag/الفيديو)) مع [تفضيلات](/tag/تفضيلات) البشر من الأمور الأساسية لإنتاج مقاطع [فيديو](/tag/فيديو) عالية الجودة. وفي هذا السياق، ظهرت طريقة جديدة تحت اسم [LocalDPO](/tag/localdpo) ([تحسين التفضيلات](/tag/[تحسين](/tag/تحسين)-[التفضيلات](/tag/التفضيلات)) المحلية المباشرة) التي تقدم بديلاً مبتكرًا لطرق [التحسين](/tag/التحسين) التقليدية.

تستخدم الأساليب الحالية، المعروفة باسم [تحسين التفضيلات](/tag/[تحسين](/tag/تحسين)-[التفضيلات](/tag/التفضيلات)) المباشرة (Direct Preference [Optimization](/tag/optimization) أو [DPO](/tag/dpo))، [نماذج](/tag/نماذج) [تقييم](/tag/تقييم) متعددة العيّنات، مما يؤدي إلى [كفاءة](/tag/كفاءة) ضعيفة وغالبًا ما ينتج عنها [توجيهات](/tag/توجيهات) غامضة. لكن مع LocalDPO، تم [تصميم](/tag/تصميم) إطار [جديد](/tag/جديد) يعتمد على [تصنيف](/tag/تصنيف) [تفضيلات](/tag/تفضيلات) محلية يستند إلى [بيانات](/tag/بيانات) [فيديو](/tag/فيديو) حقيقية، مما يسهل عملية [العملية](/tag/العملية) في المستوى الزمني-المكاني.

تعمل [LocalDPO](/tag/localdpo) من خلال [جمع بيانات](/tag/جمع-[بيانات](/tag/بيانات)) تفضيل بشكل آلي، وبذلك تولد أزواجًا من [التفضيلات](/tag/التفضيلات) [عبر](/tag/عبر) [استنتاج](/tag/استنتاج) واحد لكل طلب. يتم اعتبار [مقاطع الفيديو](/tag/مقاطع-[الفيديو](/tag/الفيديو)) عالية الجودة عينات إيجابية، بينما تُولِّد عينات سلبية عن طريق التلاعب المحلي بها باستخدام أقنعة زمنية-مكانية عشوائية، مع استعادة فقط المناطق المعدلة باستخدام [نموذج أساسي](/tag/[نموذج](/tag/نموذج)-أساسي) مُجمد.

أثناء التدريب، يتم تقديم خسارة [DPO](/tag/dpo) تعتمد على [الوعي](/tag/الوعي) الإقليمي، تركز على [تعلم](/tag/تعلم) [التفضيلات](/tag/التفضيلات) فقط في المناطق المتضررة، مما يسرع من عملية التقارب. وقد أظهرت [التجارب](/tag/التجارب) على [نماذج](/tag/نماذج) Wan2.1 وCogVideoX أن [LocalDPO](/tag/localdpo) يحسن بشكل ثابت جودة الفيديو، وتماسكه الزمني، ونقاط [تفضيلات المستخدمين](/tag/[تفضيلات](/tag/تفضيلات)-المستخدمين) بالمقارنة مع [أساليب](/tag/أساليب) ما بعد [التدريب](/tag/التدريب) الأخرى، مما يثبت فعاليته.

للراغبين في [استكشاف](/tag/استكشاف) هذا الابتكار، يمكنهم الوصول إلى الشيفرة المصدرية على [GitHub](https://github.com/1170300714/Local-DPO). ماذا تنتظرون لتغمروا في عالم [تحسين](/tag/تحسين) الفيديوهات بالذكاء الاصطناعي؟ شاركونا آرائكم في [التعليقات](/tag/التعليقات)!