في عالم الذكاء الاصطناعي، يعتبر تناسق [نماذج الفيديو](/tag/[نماذج](/tag/نماذج)-[الفيديو](/tag/الفيديو)) مع [تفضيلات](/tag/تفضيلات) البشر من الأمور الأساسية لإنتاج مقاطع [فيديو](/tag/فيديو) عالية الجودة. وفي هذا السياق، ظهرت طريقة جديدة تحت اسم [LocalDPO](/tag/localdpo) ([تحسين التفضيلات](/tag/[تحسين](/tag/تحسين)-[التفضيلات](/tag/التفضيلات)) المحلية المباشرة) التي تقدم بديلاً مبتكرًا لطرق [التحسين](/tag/التحسين) التقليدية.
تستخدم الأساليب الحالية، المعروفة باسم [تحسين التفضيلات](/tag/[تحسين](/tag/تحسين)-[التفضيلات](/tag/التفضيلات)) المباشرة (Direct Preference [Optimization](/tag/optimization) أو [DPO](/tag/dpo))، [نماذج](/tag/نماذج) [تقييم](/tag/تقييم) متعددة العيّنات، مما يؤدي إلى [كفاءة](/tag/كفاءة) ضعيفة وغالبًا ما ينتج عنها [توجيهات](/tag/توجيهات) غامضة. لكن مع LocalDPO، تم [تصميم](/tag/تصميم) إطار [جديد](/tag/جديد) يعتمد على [تصنيف](/tag/تصنيف) [تفضيلات](/tag/تفضيلات) محلية يستند إلى [بيانات](/tag/بيانات) [فيديو](/tag/فيديو) حقيقية، مما يسهل عملية [العملية](/tag/العملية) في المستوى الزمني-المكاني.
تعمل [LocalDPO](/tag/localdpo) من خلال [جمع بيانات](/tag/جمع-[بيانات](/tag/بيانات)) تفضيل بشكل آلي، وبذلك تولد أزواجًا من [التفضيلات](/tag/التفضيلات) [عبر](/tag/عبر) [استنتاج](/tag/استنتاج) واحد لكل طلب. يتم اعتبار [مقاطع الفيديو](/tag/مقاطع-[الفيديو](/tag/الفيديو)) عالية الجودة عينات إيجابية، بينما تُولِّد عينات سلبية عن طريق التلاعب المحلي بها باستخدام أقنعة زمنية-مكانية عشوائية، مع استعادة فقط المناطق المعدلة باستخدام [نموذج أساسي](/tag/[نموذج](/tag/نموذج)-أساسي) مُجمد.
أثناء التدريب، يتم تقديم خسارة [DPO](/tag/dpo) تعتمد على [الوعي](/tag/الوعي) الإقليمي، تركز على [تعلم](/tag/تعلم) [التفضيلات](/tag/التفضيلات) فقط في المناطق المتضررة، مما يسرع من عملية التقارب. وقد أظهرت [التجارب](/tag/التجارب) على [نماذج](/tag/نماذج) Wan2.1 وCogVideoX أن [LocalDPO](/tag/localdpo) يحسن بشكل ثابت جودة الفيديو، وتماسكه الزمني، ونقاط [تفضيلات المستخدمين](/tag/[تفضيلات](/tag/تفضيلات)-المستخدمين) بالمقارنة مع [أساليب](/tag/أساليب) ما بعد [التدريب](/tag/التدريب) الأخرى، مما يثبت فعاليته.
للراغبين في [استكشاف](/tag/استكشاف) هذا الابتكار، يمكنهم الوصول إلى الشيفرة المصدرية على [GitHub](https://github.com/1170300714/Local-DPO). ماذا تنتظرون لتغمروا في عالم [تحسين](/tag/تحسين) الفيديوهات بالذكاء الاصطناعي؟ شاركونا آرائكم في [التعليقات](/tag/التعليقات)!
ابتكار جديد في نماذج فيديو الذكاء الاصطناعي: تحسين التفضيلات المحلية لزيادة جودة الفيديو!
تقدم LocalDPO إطاراً مبتكراً لتحسين جودة الفيديو عبر توافق تفضيلات المستخدمين مع نماذج الذكاء الاصطناعي. يعتمد النظام على بيانات حقيقية لتوليد مقاطع فيديو فائقة الجودة بكفاءة عالية.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
