في عالم يتسارع فيه تطور الذكاء الاصطناعي، أصبحت نماذج اللغات الضخمة (Large Language Models) تعتمد بشكل متزايد على المهارات القابلة لإعادة الاستخدام. وهذه المهارات قد تتضمن مستندات توضح إجراءات محددة لأداء مهام معينة. ومع ذلك، فإن هذا التوجه يفتح الباب أمام نوع جديد من التهديدات والعيوب التي يجب على هذه الأنظمة إدارتها.
في دراسة جديدة، تم التركيز على اتجاهين مكملين لهذا التهديد. الأول يتعلق بالدفاعات المستندة إلى الأوصياء (guardians)؛ حيث تم تطوير وكيل نمذجي يعمل كوسيط للوصول إلى ملفات المهارات. يتميز هذا النظام بنوعين: "الأوصياء الديناميين" الذين يتدخلون في الوقت الحقيقي عند طلب الوصول، و"الأوصياء الثابتين" الذين يعيدون كتابة هذه الملفات في وقت البناء. أظهرت الدراسات أن هذه الدفاعات قللت معدل نجاح الهجمات بنسبة تفوق الخمسين بالمئة، مع الحفاظ على فعالية المهام.
أما الاتجاه الثاني، فهو اختبار قوة هذه الدفاعات من خلال إعادة صياغة الهجمات. حيث تم استخدام أربعة أنواع من الهجمات التي تحافظ على التعليمات الضارة ولكن تغير الصياغة. في حالة الإعدادات التي لا تتضمن الأوصياء، ارتفع معدل نجاح الهجمات إلى 81.4%، بينما انخفض هذا المعدل إلى 18.6% عند استخدام الوصي الديناميكي، مما يبرهن على فعالية التدخل الفوري.
بهذا، تبرز أهمية تطوير استراتيجيات دفاعية جديدة لحماية أنظمة الذكاء الاصطناعي من التهديدات المتزايدة. ما هي الطرق الأخرى التي تعتقد أنه يمكن استخدامها كدفاعات ضد هذه الهجمات؟ شاركونا في التعليقات.
كيف تحمي نماذج الذكاء الاصطناعي من هجمات حقن المهارات الخطيرة؟
تتزايد الاعتماديات على نماذج اللغات الضخمة في تطبيقات الذكاء الاصطناعي، مما يجعلها عرضة للهجمات. دراسة جديدة تكشف عن استراتيجيات فعّالة لحماية هذه النماذج من هجمات حقن المهارات.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
