في ظل التطورات السريعة التي تشهدها نماذج اللغة الكبيرة متعددة الوسائط (Multimodal Large Language Models)، برزت القضايا المتعلقة بالخصوصية والأمان، حيث قد تقوم هذه النماذج بتخزين معلومات حساسة. ولحل هذه المشكلة، تم اقتراح مفهوم التعلم الآلي المتجدد (Machine Unlearning) كوسيلة فعالة لإزالة المعلومات غير المرغوب فيها من النماذج المدربة دون الحاجة إلى إعادة تدريبها من الصفر، مع الحفاظ على فائدتها العامة.
ومع ذلك، لا يزال إجراء التعلم المتجدد في النماذج متعددة الوسائط يمثل تحديًا، فالتقنيات الحالية التي تعتمد على التدريب غالبًا ما تعاني من التوازن بين الفعالية والحفاظ على الأداء. على النقيض، فإن الطرق التي لا تعتمد على التدريب، مثل التعلم في السياق (in-context unlearning)، تحافظ على فائدة النموذج دون تحديث المعلمات، لكنها قد لا تزال عرضة لهجمات الهندسة العكسية.
تقديمنا الجديد، الإطار المعتمد على تقنية VGID (Visual-Noise Guided In-Context Distillation)، يمثل خطوة رائدة نحو حل هذه التحديات. يقوم هذا الإطار بشكل ديناميكي بإنشاء توزيع تعليمي موجه لإزالة المعرفة غير المرغوب فيها من النموذج الأساسي الثابت، وذلك من خلال تدخل مزدوج الأنماط يجمع بين الاضطراب البصري والتعلم في السياق النصي.
تساعد هذه الطريقة على توجيه نموذج الطالب نحو إزالة المعرفة غير المرغوب فيها على مستوى المعلمات بدون الحاجة لنماذج معلم خارجية أو توضيحات استجابة غير مرغوب فيها. نتائج التجارب أظهرت أن تقنية VGID تحقق فعالية قوية في إزالة المعلومات غير المرغوب فيها، بينما تحافظ على متانة أداء النموذج، حيث قللت من درجة ROUGE-L لمجموعة النسيان بمقدار 0.371 مع انخفاض بسيط قدره 0.055 في درجة ROUGE-L لمجموعة الاحتفاظ.
إن هذه التقنية تمثل أفقاً جديداً في معالجة قضايا الخصوصية والأمان في الذكاء الاصطناعي، مما يوفر لنا نهجًا أكثر أمانًا وفاعلية. فما رأيكم في هذه التقنية الجديدة؟ شاركونا آرائكم في التعليقات!
كيف يمكن أن يحدث التعلم الآلي المتجدد؟ اكتشف إطار عمل VGID لإزالة المعلومات الغير مرغوب فيها من نماذج الذكاء الاصطناعي متعددة الوسائط!
تقدم تقنية VGID أسلوبًا مبتكرًا لإزالة المعرفة غير المرغوبة من نماذج اللغة الكبيرة متعددة الوسائط دون الحاجة لإعادة تدريبها. استخدم تقنيات التعلم الوجه والكتابة لتحقيق فعالية عالية مع الحفاظ على أداء النموذج.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
