في السنوات الأخيرة، أصبحت وكلاء واجهة المستخدم الرسومية (GUI) المعززة بنماذج اللغات المرئية (VLMs) جزءاً أساسياً من تجاربنا الرقمية. ومع ذلك، إن فشلهم في التمييز بين العناصر الموثوقة والمحتوى المُنشأ من قبل المستخدمين قد يُعتبر تهديداً كبيراً. هنا يأتي دور MIRAGE (حقن مظهر التهديدات الواقعية في واجهات GUI المحمولة) – تقنية جديدة تسعى لاستغلال هذه الثغرات.
تعمل MIRAGE على تحويل لقطة شاشة عادية من الهاتف المحمول إلى عينات حقن عبر ثلاث مراحل رئيسية. المرحلة الأولى تتضمن استخدام أدوات محلية لتحديد المناطق التي يُمكن للمستخدم التحكم فيها، في حين يتمثل دور المرحلة الثانية في إنشاء نصوص تحتوى على محتوى مضلل يتماشى مع تصميم التطبيق الأصلي. وأخيراً، يقوم المُعدِل بمراقبة الواقعية وتحقيق توازن في العينة عبر التطبيقات المختلفة والأغراض الهجومية.
لقد أثبتت التجارب أن جميع نماذج (VLM) الخمسة المدروسة كانت عرضة لهجمات MIRAGE، مع وجود نسب نجاح تصل إلى 30%. وقد أظهرت نتائج التقييم البشري أن MIRAGE حققت معدل واقعية أعلى من الهجمات السابقة، مما يدل على القوة والابتكار في تصميم هذه التقنية. لكن التحدي الأكبر هو الحفاظ على عدم تمييز الصور المُعَدة عن المحتوى الحقيقي – وهو ما تم تحقيقه بفضل الفصل بين مراحل التحكم في النطاق والواقعية.
هل سيكون من الممكن للأنظمة المستقبلية أن تكتشف وتدافع أمام هذه التهديدات الجديدة؟ تابعونا لنناقش الآثار المحتملة لتقنية MIRAGE وكيف ستؤثر على المستقبل الأمني للتكنولوجيا.
كشف النقاب عن MIRAGE: ثغرة جديدة تهدد وكلاء واجهة المستخدم الرسومية عبر المحتوى المُنشأ من قبل المستخدمين
تقدم تقنية MIRAGE طريقة مبتكرة لاستغلال ثغرات في وكلاء واجهة المستخدم الرسومية عبر حقن نصوص مضللة. التجارب تشير إلى أن جميع نماذج اللغات المرئية (VLM) المستعملة معرضة لهذا النوع من الهجمات.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
