ترتفع معدلات استخدام أنظمة توليد الفيديو المدعومة بالذكاء الاصطناعي بشكل ملحوظ، مما يطرح تحديات كبيرة أمام مراقبة المحتوى، وخاصةً عند الحديث عن المحتوى البالغ والمحتويات الجنسية الصريحة. في هذا السياق، تعمل الطرق التقليدية للكشف إما على التحفيزات (prompts) أو على مخرجات بيكسل مضمنة. لكن هذه الطرق تفتقر إلى فحص التمثيلات الداخلية الغنية التي تتشكل أثناء عملية التوليد.
في دراسة جديدة، تم اقتراح إطار عمل مبتكر لاستكشاف الفضاء الكامن (Latent Space Probing) يقوم بالتقاط التمثيلات الكامنة التي تم تنقيتها بواسطة نموذج "CogVideoX" خلال مرحلة الاستدلال، ويقوم بإرفاق مصنفات خفيفة الأداء لتحقيق الكشف في الوقت الحقيقي عن المحتوى البالغ.
لمساندة هذا العمل، تم إنشاء مجموعة بيانات ثنائية ضخمة تحتوي على 11039 مقطع فيديو مدته عشرة ثوانٍ، منها 5086 مقطعًا ينتهك القواعد و5953 مقطعًا لا ينتهكها، تم جمعها من مواقع البالغين وموقع يوتيوب على التوالي.
كما تم تقديم معماريتين لمصنفات استكشاف خفيفة الوزن، وتم تدريبها وتقييمها على مجموعة البيانات. وتظهر النتائج أن إشارات الفضاء الكامن تحتوي على ميزات تمييزية قوية للكشف عن المحتوى الضار، حيث حققت دراسة حوالي 97.29% في نتيجة F1 في مجموعة الاختبار المحجوزة، مع زمن استجابة في نطاق 4-6 مللي ثانية. وتُشير النتائج إلى أن استكشاف الفضاء الكامن يعزز من أداء الكشف ويخفض التكاليف.
هذا التطور يعد خطوة هامة نحو تحسين استخدام تقنيات الذكاء الاصطناعي في مجالات حساسة مثل حماية المجتمعات من المحتويات الضارة. ما رأيكم في هذا التطور؟ شاركونا في التعليقات.
اكتشف كيف تعزز تقنيات الذكاء الاصطناعي الكشف عن المحتوى البالغ في الفيديوهات!
تمثل أنظمة توليد الفيديو المدعومة بالذكاء الاصطناعي تحديًا كبيرًا في مراقبة المحتوى، خصوصًا عند التعامل مع المواد البالغة. تقدم الدراسة إطارًا جديدًا لاستكشاف الفضاء الكامن للكشف عن هذه المواد بدقة عالية.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
