UniEditBench: معيار موحد وغير مكلف لتحرير الصور والفيديوهات يعيد تشكيل تقييم النماذج البصرية
تقدم UniEditBench معيارًا مبتكرًا لتحرير الصور والفيديوهات، مما يسهل المقارنات العادلة بين النماذج المختلفة. يعتمد هذا المعيار على نموذج MLLM مدمج عالي الأداء لتقديم تقييمات دقيقة وفعالة بتكاليف منخفضة.
تواجه عملية تقييم نماذج تحرير الصور والفيديو تحديات كبيرة، إذ يتسم هذا المجال بالتفرقة بين الطرق والنماذج المختلفة. فمعظم المعايير الحالية معدة خصيصًا لفئات معينة، مما يجعل من الصعب إجراء مقارنات عادلة بين أنماط مختلفة. بالإضافة إلى ذلك، يعاني مجال تحرير الفيديو من نقص في المعايير القابلة للاعتماد.
وفي خطوة ثورية، تم تقديم UniEditBench، وهو معيار موحد لتقييم تحرير الصور والفيديوهات، يعتمد على بروتوكول مشترك يدعم الأساليب المعتمدة على إعادة البناء (reconstruction-based) والأساليب المدفوعة بالتعليمات (instruction-driven).
يتضمن UniEditBench تصنيفًا منظمًا لتسعة عمليات صورة تشمل: (إضافة) Add، (إزالة) Remove، (استبدال) Replace، (تغيير) Change، (معتمد على الضربات) Stroke-based، (استخراج) Extract، (تعديل) Adjust، (عد) Count، و(إعادة ترتيب) Reorder، بالإضافة إلى ثماني عمليات لفيديوهات تغطي مهام تركيبية معقدة مثل العد وإعادة الترتيب المكاني.
لتمكين تقييم قابل للتوسع، تم تقطير نموذج مدمج عالي السعة (Qwen3-VL-235B-A22B Instruct) إلى مقيمات خفيفة الوزن (4B/8B) التي تقدم تقييمات متعددة الأبعاد تشمل الدقة الهيكلية، محاذاة النص، اتساق الخلفية، الطبيعة، والاتساق الزمني المكاني (بالنسبة للفيديوهات).
أظهرت التجارب أن المقيمات المستخلصة تحتفظ بتوافق قوي مع تقييمات البشر، وتقلل بشكل كبير من تكاليف النشر بالمقارنة مع نموذج المعلم. يقدم UniEditBench بروتوكولاً عملياً وقابلاً للتكرار لقياس أساليب تحرير الصور الحديثة.
يمكن الوصول إلى المعيار والنماذج المرتبطة به عبر الرابط: https://github.com/wesar1/UniEditBench
وفي خطوة ثورية، تم تقديم UniEditBench، وهو معيار موحد لتقييم تحرير الصور والفيديوهات، يعتمد على بروتوكول مشترك يدعم الأساليب المعتمدة على إعادة البناء (reconstruction-based) والأساليب المدفوعة بالتعليمات (instruction-driven).
يتضمن UniEditBench تصنيفًا منظمًا لتسعة عمليات صورة تشمل: (إضافة) Add، (إزالة) Remove، (استبدال) Replace، (تغيير) Change، (معتمد على الضربات) Stroke-based، (استخراج) Extract، (تعديل) Adjust، (عد) Count، و(إعادة ترتيب) Reorder، بالإضافة إلى ثماني عمليات لفيديوهات تغطي مهام تركيبية معقدة مثل العد وإعادة الترتيب المكاني.
لتمكين تقييم قابل للتوسع، تم تقطير نموذج مدمج عالي السعة (Qwen3-VL-235B-A22B Instruct) إلى مقيمات خفيفة الوزن (4B/8B) التي تقدم تقييمات متعددة الأبعاد تشمل الدقة الهيكلية، محاذاة النص، اتساق الخلفية، الطبيعة، والاتساق الزمني المكاني (بالنسبة للفيديوهات).
أظهرت التجارب أن المقيمات المستخلصة تحتفظ بتوافق قوي مع تقييمات البشر، وتقلل بشكل كبير من تكاليف النشر بالمقارنة مع نموذج المعلم. يقدم UniEditBench بروتوكولاً عملياً وقابلاً للتكرار لقياس أساليب تحرير الصور الحديثة.
يمكن الوصول إلى المعيار والنماذج المرتبطة به عبر الرابط: https://github.com/wesar1/UniEditBench
📰 أخبار ذات صلة
أبحاث
Claude Mythos: هل يصبح سلاحًا سيبرانيًا فتاكًا في عصر الذكاء الاصطناعي؟
البوابة العربية للأخبار التقنيةمنذ 6 ساعة
أبحاث
هل ستمكننا الذكاء الاصطناعي من السيطرة على العالم؟ رؤى قادة التكنولوجيا
وايردمنذ 9 ساعة
أبحاث
ديب إر ميد: ثورة الذكاء الاصطناعي في البحث الطبي المعتمد على الأدلة!
أركايف للذكاءمنذ 16 ساعة