تسعى تقنيات الذكاء الاصطناعي اليوم إلى زيادة أداء نماذج اللغة الكبيرة (LLMs) عبر استغلال كميات ضخمة من البيانات، لكن يبدو أن هذا النجاح يأتي مع ثمن تدفعه هذه الأنظمة في شكل ثغرات أمنية خطيرة. في دراسة جديدة، تم تقديم طريقة هجوم مبتكرة تعتمد على تسميم البيانات، حيث يمكن للخبيثين أن يخفوا تعليمات ضارة عبر تلاعب دقيق بالمعلومات.
تعمل هذه الطريقة من خلال تعليم نموذج اللغة العواطف والمفاهيم المعقدة، مما يسمح له بترميز وفك ترميز التعليمات الضارة مستندةً إلى رموز معرفية مشترك، مما يسهل الهجمات الخفية المعروفة أيضًا بالهجمات التحكُّمية (Covert Control Attacks). فقد أظهرت الأبحاث أن هذه الهجمات تتفوق على الهجمات التقليدية المعتمدة على أساليب فجائية بنحو 40% في معدلات النجاح.
عند اختبار هذه الطريقة على خمسة نماذج لغة متنوعة، تبيَّن أنها قادرة على تجاوز تدابير الدفاع القائمة، حيث حققت نجاحًا بنسبة 93% بعد تدابير الدفاع ضد الأبواب الخلفية و98% بعد تدابير الدفاع ضد الحقن الحثيث.
تطرح هذه النتائج تساؤلات مهمة حول مدى أمان نماذج اللغة الكبيرة في مواجهة هذه الأنواع من الهجمات، مما يستدعي تطوير استراتيجيات دفاعية أكثر قوة لحماية الأنظمة من التلاعب. في ضوء هذه الاكتشافات، هل تحتاج مجال الأمان التكنولوجي إلى إعادة تقييم شاملة؟ ما رأيكم في هذا التطور؟ شاركونا في التعليقات.
هجمات خفية: كيف يمكن أن تتلاعب نماذج اللغة الكبيرة من خلال تسميم البيانات؟
تظهر أبحاث جديدة أن نماذج اللغة الكبيرة (LLMs) قد تكون عرضة لهجمات خفية تعتمد على تسميم البيانات. هذه الهجمات تفتح أفقًا جديدًا من القلق فيما يتعلق بأمان هذه الأنظمة المعقدة.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
