في عالم الذكاء الاصطناعي، تزداد الحاجة إلى نماذج اللغة الكبيرة (LLMs) في المجالات الحساسة للخصوصية، حيث يجب على المستخدمين موازنة خطر كشف البيانات عبر واجهات برمجة التطبيقات الخارجية مع التكلفة العالية للمعالجة المحلية. ظهر التعلم المنفصل (Split Learning) كإحدى الأساليب الواعدة لضبط نماذج LLMs في ظل الموارد المحلية المحدودة، ولكنه يأتي بمخاطر خصوصية جديدة.
تتطرق الأبحاث السابقة بشكل أساسي إلى تسرب بيانات الإدخال الخاصة، غالبًا عبر هجمات الانقلاب (Inversion Attacks) على التمثيلات الوسيطة، بينما لم يتم استكشاف إمكانية تسرب المعلومات الحساسة من مخرجات الاستجابات الناتجة. في هذا السياق، يكشف البحث الجديد عن نقاط ضعف جديدة في نماذج التعليم المنفصل، من خلال تقديم نموذج الهجوم المعروف باسم "نموذج الانقلاب المعالج مع البداية الثنائية (PIDI)". يُعتبر هذا الهجوم ذو مرحلتين، ويستهدف كلا من المدخلات الخاصة والاستجابات، مما يُظهر تفوقًا ملحوظًا على تقنيات الانقلاب السابقة.
للتصدي للتهديدات من الجانبين، تم اقتراح تقنية "الحارس الثنائي القائم على المحولات مع دفاع المعلومات المتبادلة (ADMI)"، التي تجمع بين استراتيجية التسخين المحلي القائمة على المحولات وتقييد المعلومات المتبادلة، لتوفير حماية قوية للخصوصية بأقل تأثير على أداء المهام. تُظهر التجارب الموسعة عبر مجموعة متنوعة من المهام والنماذج أن ADMI يمثل دفاعًا فعالًا ضد هجمات PIDI وغيرها من هجمات الانقلاب المتطورة.
إذا كنت مهتمًا بمعرفة المزيد حول كيفية حماية بياناتك في ظل استخدام نماذج اللغة الكبيرة، يمكنك الاطلاع على الكود الذي تم نشره على GitHub! فهل تعتقد أن نماذج الذكاء الاصطناعي قادرة على تجاوز هذه التحديات؟ شاركونا بآرائكم في التعليقات.
هل نماذج اللغة الكبيرة آمنة؟ كشف أسرار تسرب البيانات وطرق الدفاع المتقدمة!
تسرب البيانات من نماذج اللغة الكبيرة (LLMs) يمثل تحديًا مستمرًا في ظل مخاوف الخصوصية. دراسة جديدة تكشف عن نقاط ضعف جديدة وتقدم حلولًا مبتكرة لحماية البيانات.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
