في عالم الذكاء الاصطناعي، تُمثل [نماذج [الرؤية](/tag/الرؤية) واللغة](/tag/[نماذج](/tag/نماذج)-[الرؤية](/tag/الرؤية)-واللغة) ([Vision-Language Models](/tag/vision-language-models)) نقطة [تحول](/tag/تحول) في كيفية تعامل الأنظمة مع [الصور](/tag/الصور) والنصوص. ومع ذلك، لا تخلو هذه [النماذج](/tag/النماذج) من التحديات، حيث تواجه تهديدات من اعتداءات قد تؤثر على استجاباتها. في هذا السياق، تمثل [الدراسة](/tag/الدراسة) الجديدة المعلن عنها في arXiv تقدمًا ملحوظًا في مجال [الأمن السيبراني](/tag/[الأمن](/tag/الأمن)-السيبراني) للذكاء الاصطناعي.
يقوم الباحثون بدراسة "[استحواذ](/tag/استحواذ) [الانتباه](/tag/الانتباه)"، وهي طريقة جديدة للتلاعب باستجابات النماذج، حيث تهدف إلى جعل [نموذج [الرؤية](/tag/الرؤية) واللغة](/tag/[نموذج](/tag/نموذج)-[الرؤية](/tag/الرؤية)-واللغة) يظل فعالًا عند مواجهة استفسارات مختلفة. تكمن الفكرة الرئيسية في أن الاعتداءات الحالية قد تفقد فعاليتها عند تطبيقها على [نصوص](/tag/نصوص) مختلفة مع نفس المدخلات، مما يستدعي الحاجة لأسلوب مبتكر.
تبين [الدراسة](/tag/الدراسة) أن [نجاح](/tag/نجاح) انتقال الاستجابات المرتبطة بالاعتداء يرتبط بحفظ نمط [انتباه](/tag/انتباه) يعتمد على [الصورة](/tag/الصورة) خلال عملية [توليد](/tag/توليد) الاستجابة. بناءً على ذلك، تم [اقتراح](/tag/اقتراح) "[استحواذ](/tag/استحواذ) [الانتباه](/tag/الانتباه)" كوسيلة للتحكم في [التوزيعات](/tag/التوزيعات) الداخلية للانتباه من أجل المحافظة على نمط [صورة](/tag/صورة) مهيمن. من خلال تعزيز تأثير الرموز البصرية على الاستجابات المستهدفة، بينما يتم تقليل تأثير الرموز النصية، يمكن للنموذج الاعتراف بسياسات استجابة أكثر [مرونة](/tag/مرونة).
تتضمن النتائج التجريبية على [نماذج [الرؤية](/tag/الرؤية) واللغة](/tag/[نماذج](/tag/نماذج)-[الرؤية](/tag/الرؤية)-واللغة) الشهيرة أظهرت أن "[استحواذ](/tag/استحواذ) [الانتباه](/tag/الانتباه)" يساهم بشكل كبير في [تحسين](/tag/تحسين) القدرة على الانتقال [عبر](/tag/عبر) استفسارات مختلفة واستجابات متنوعة، مما يوفر [رؤى](/tag/رؤى) جديدة حول دور [استقرار](/tag/استقرار) [الانتباه](/tag/الانتباه) في تعديل الاستجابات قابلة للنقل. هذه النتائج تمثل خطوة مهمة [نحو](/tag/نحو) تعزيز [أمان](/tag/أمان) وكفاءة [نماذج](/tag/نماذج) الذكاء الاصطناعي، وتفتح آفاقًا جديدة للبحث والتطوير في هذا المجال الحيوي.
استحواذ الانتباه: كيف تتلاعب نماذج الرؤية واللغة بالاستجابات عبر استفسارات متعددة؟
تتناول هذه الدراسة كيفية تعرض نماذج الرؤية واللغة (Vision-Language Models) لاعتداءات تتلاعب باستجاباتها عبر استفسارات متنوعة، مقدمةً طريقة جديدة تُسمى 'استحواذ الانتباه' لتحسين فعالية هذه الاعتداءات. النتائج تكشف عن عمق تأثير الأنماط البصرية على استجابات النماذج.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
