مع تسارع التطورات في [نماذج تحويل](/tag/[نماذج](/tag/نماذج)-[تحويل](/tag/تحويل)) النص إلى [فيديو](/tag/فيديو) (Text-to-Video)، تظهر [مخاوف](/tag/مخاوف) متزايدة بشأن [مخاطر](/tag/مخاطر) [الأمان](/tag/الأمان) المرتبطة بها. بينما تم [استكشاف](/tag/استكشاف) الثغرات في [نماذج [اللغة](/tag/اللغة) الكبيرة](/tag/[نماذج](/tag/نماذج)-[اللغة](/tag/اللغة)-الكبيرة) (Large Language [Models](/tag/models)) ونماذج [تحويل النص](/tag/[تحويل](/tag/تحويل)-النص) إلى [صورة](/tag/صورة) ([Text-to-Image](/tag/text-to-image))، لم تُستكشف [نماذج تحويل](/tag/[نماذج](/tag/نماذج)-[تحويل](/tag/تحويل)) النص إلى [فيديو](/tag/فيديو) بشكل كافٍ، مما يترك فجوة كبيرة في [الأمان](/tag/الأمان).
لملء هذه الفجوة، تم تقديم [تقنية جديدة](/tag/[تقنية](/tag/تقنية)-جديدة) تُسمى SceneSplit، وهي طريقة [اختراق](/tag/اختراق) جديدة تعتمد على تقسيم السرد الضار إلى مشاهد متعددة، بحيث يكون كل مشهد آمن في حد ذاته. يعمل هذا الأسلوب على التلاعب في مساحة المخرجات التوليدية، مجموعة النتائج المحتملة لجميع الفيديوهات المتعلقة بنص معين، وذلك باستخدام الجمع بين المشاهد كقيد قوي لتوجيه النتيجة النهائية.
بينما تتوافق كل مشهد بشكل فردي مع مساحة واسعة وآمنة حيث تكون معظم النتائج غير ضارة، فإن جمعها بشكل تسلسلي يقيّد هذه المساحة بشكل جماعي، مما يقود إلى منطقة غير آمنة ويزيد بشكل كبير من احتمال إنتاج [فيديو](/tag/فيديو) ضار. كما يتم تعزيز هذا الآلية الأساسية من خلال تلاعب مشهدي متكرر، مما يتجاوز فلتر [الأمان](/tag/الأمان) ضمن هذه المنطقة غير الآمنة.
علاوةً على ذلك، يتم [تحسين](/tag/تحسين) فعالية الهجوم الإجمالية من خلال مكتبة [استراتيجيات](/tag/استراتيجيات) تعيد استخدام [نماذج](/tag/نماذج) [هجمات](/tag/هجمات) ناجحة. للتأكد من فعالية أسلوب SceneSplit، تم تقييمه [عبر](/tag/عبر) 11 فئة [أمان](/tag/أمان) من T2VSafetyBench على [نماذج تحويل](/tag/[نماذج](/tag/نماذج)-[تحويل](/tag/تحويل)) النص إلى [فيديو](/tag/فيديو). وأظهرت النتائج معدل [نجاح](/tag/نجاح) [هجوم](/tag/هجوم) متوسط (Attack Success Rate) مرتفعًا يصل إلى 77.2% على [نموذج](/tag/نموذج) Luma Ray2، 84.1% على Hailuo، 78.2% على Veo2، 78.6% على Kling V1.0، و68.6% على Sora2، متفوقًا بوضوح على القواعد الأساسية الموجودة.
[هذا العمل](/tag/هذا-العمل) لا يكشف فقط عن ضعف [آليات](/tag/آليات) [الأمان](/tag/الأمان) الحالية في [نماذج تحويل](/tag/[نماذج](/tag/نماذج)-[تحويل](/tag/تحويل)) النص إلى فيديو، بل يوفر أيضًا [رؤى](/tag/رؤى) جديدة لفهم وتحسين هذه النماذج، مما يجعلها أكثر أمانًا في المستقبل.
استراتيجيات التهديد لأمان نماذج تحويل النص إلى فيديو: الاستكشاف المثير لـ SceneSplit!
يتناول البحث الجديد استراتيجيات جديدة للاختراق في نماذج تحويل النص إلى فيديو عبر استخدام تقنية SceneSplit، التي تقسم السرد الضار إلى مشاهد منفصلة. تكشف النتائج عن ضعف آليات الأمان الحالية وتفتح آفاقًا جديدة لتحسين سلامة هذه النماذج.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
