تواجه نماذج اللغات الضخمة متعددة الوسائط (MLLMs) تحديات متزايدة تتعلق بالخصوصية والامتثال للتنظيمات، مما يجعل الحاجة إلى تقنيات جديدة مثل التعلم الآلي غير المراقب (Machine Unlearning - MU) حتمية. تعد هذه التقنية ضرورة لفصل البيانات الحساسة عن النماذج مع الحفاظ على الأداء الجيد.
في خطوة مبتكرة، تم تقديم مفهوم جديد يسمى Source-free Proxy Anchor Concept Erasure (SPACE)، والذي يمثل الإطار الأول من نوعه القائم على نموذج التعلم غير المراقب بدون الحاجة للوصول إلى البيانات الأصلية. يتكون SPACE من مرحلتين رئيسيتين:
1. **اختيار نقاط الوصل المستندة إلى النصوص (Text-Guided Proxy Anchor Selection - TPAS)**: حيث يتم استرجاع نقاط وصل ذات دلالات مشابهة من مساحة الميزات المشتركة.
2. **العزل الدلالي ذو القيود المزدوجة (Dual-Constraint Semantic Isolation - DCSI)**: والتي تهدف إلى تحسين تلك النقاط لحذف المفاهيم المستهدفة بصورة غير مباشرة. يضمن DCSI أن التحديثات تتمركز ضمن المساحة الفارغة للمعرفة المحتفظ بها، مما يحافظ على سلامة الهيكل العام للنموذج.
بالإضافة إلى ذلك، تم إثبات أن SPACE يحد من الاضطرابات على المعرفة المحتفظ بها، كما يعزز من عشوائية الميزات، مما يشكل ضمانة لاستمرار الأداء المتميز للنموذج. وأظهرت التجارب الواسعة التي أجريت على ستة مجموعات بيانات أن أداء SPACE يتعادل مع الأساليب المتطورة التي تعتمد على البيانات، مما يعكس فعاليته في سيناريوهات التعلم غير المراقب بدون مصدر. سيتم إصدار الكود المصدري قريباً، مما سيسمح للمطورين والمبتكرين بالاستفادة من هذه التقنية الثورية في تطوير تطبيقات جديدة وأكثر أمانًا في مجال الذكاء الاصطناعي.
ثورة في عالم الذكاء الاصطناعي: مفهوم SPACE لإزالة البيانات الحساسة بدون مصدر!
تقدم SPACE نهجًا مبتكراً لإزالة البيانات الحساسة من نماذج اللغات الضخمة دون الحاجة إلى الوصول إلى البيانات الأصلية، مما يعزز من أمان الخصوصية. يعكس هذا التطور التحول نحو تقنيات أكثر أمانًا وفعالية في الذكاء الاصطناعي.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
