تسليط الضوء على مسألة أمن البيانات في نماذج اللغات الكبيرة (Large Language Models) أصبح ضرورة ملحة، وذلك بعد أن كشف بحث حديث عن ثغرة خطيرة في طريقة تعديل هذه النماذج. يُعتبر تعديل نماذج اللغات أو ما يُعرف بـ "Locate-then-edit" منصة تراهن عليها الكثير من الشركات، إذ يُمكنها تجنب إعادة تدريب النماذج بالكامل من خلال تعديل المعلمات مباشرة. لكن، كما يُظهر هذا البحث، فإن هذه الطريقة ليست محصنة ضد المخاطر.

فقد تم الكشف عن هجوم جديد يُعرف باسم KSTER، وهو اختصار لـ "Key Space Reconstruction then Entropy Reduction". يعتمد هذا الهجوم على هيكلية الصفوف المنخفضة التي تُخزن معلومات التحديثات، مما يتيح للمهاجمين استعادة البيانات المُعدلة عبر تحليل طيفي معقد. بهذا، يُمكن للمهاجمين استرجاع معلومات حساسة قد يُفترض أنها اختفت.

تم إثبات ذلك من خلال تجارب مكثفة على نماذج لغوية متعددة كانت النتائج فيها مقلقة للغاية، حيث أظهرت نسبة عالية من نجاح استعادة البيانات المُعدلة.

ولحماية النماذج من هذا النوع من الهجمات، يقترح الباحثون استراتيجية جديدة تُسمى "subspace camouflage"، والتي تهدف إلى تشويش آثار التحديثات باستخدام معلومات غير حقيقية لحماية أمن البيانات، دون التأثير سلبًا على كفاءة التعديل.

هذا البحث يفتح النقاش حول الأمان في عالم الذكاء الاصطناعي، خصوصًا في ظل الاعتماد المتزايد على نماذج اللغات في مختلف التطبيقات. هل ستكون الحلول الدفاعية المقترحة قادرة على جعل هذه النماذج أكثر أمانًا؟ في عالم تتزايد فيه التهديدات، يبدو أن الحفاظ على الأمان يتطلب المزيد من الابتكار والتفكير الإبداعي.