في عالم يتزايد فيه استخدام صور الذكاء الاصطناعي (AI)، يصبح من الضروري إيجاد سبل للكشف عن الصور المزيفة. قام الباحثون في دراسة جديدة بتقديم مفهوم "تجانس النظرات الاجتماعية" (Social Gaze Consistency) كأداةSemantical جديدة لتحديد صور الذكاء الاصطناعي. تجانس النظرات يشير إلى توافق اتجاه النظر، ومحاذاة الرأس والعين، ومكان بؤبؤ العين بين الأفراد المتفاعلين.
تعتبر هذه الإشارة الجديدة محوراً هاماً يختلف عن الطرق التقليدية التي تركز على العيوب منخفضة المستوى، مثل بصمات البيكسل أو تشوهات التردد. حيث قام الباحثون بتطبيق هذا المفهوم من خلال عدة آليات مزدوجة، مثل إنشاء مجموعة بيانات تشخيصية تتحقق من دقة الصور من حيث التجانس البصري، مما يمنع استغلال نقاط الضعف لدى المولدات.
أحد الابتكارات الرئيسية هو استخدام إشراف على تسميات مؤلفة (Block-Compositional Caption Supervision) يضمن أن هذا الإشراف يُحافظ على تماسك الاستدلال عبر 1250 عنوان مجمع، مما يعزز دقة التصنيف.
علاوة على ذلك، أظهرت الأدلة من التجارب أن استخدام إشراف متعدد الهيكليات جعل أداء آلية FakeVLM في مجموعة بيانات COCOAI يتحسن بنسبة 3.7 نقطة مئوية، مع تحسينات متزامنة في استدعاء الفئات الحقيقية والزائفة.
هذه النتائج تدل على أن المناهج المبتكرة للكشف عن الصور المولدة بواسطة الذكاء الاصطناعي يمكن أن تقدم أدوات قوية في مواجهة التحديات الأخلاقية والتقنية التي يطرحها هذا المجال.
ما رأيكم في استخدام تجانس النظرات كأداة للكشف عن صور الذكاء الاصطناعي؟ شاركونا في التعليقات.
حينما تخوننا أعيننا: اكتشاف صورة الذكاء الاصطناعي عبر تجانس النظرات الاجتماعية
تقدم دراسة جديدة مفهوم التجانس البصري الاجتماعي كأداة قوية للكشف عن الصور المولدة بواسطة الذكاء الاصطناعي. مع تزايد دقة النماذج التوليدية، يظهر هذا البحث طريقة مبتكرة للكشف عن التلاعب في الصور.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
