في عالم الذكاء الاصطناعي، تبقى مسألة الخصوصية واحدة من أبرز التحديات التي تواجه نماذج اللغة الكبيرة (Large Language Models - LLMs). بينما تقدم التقنيات الحالية حلولًا لإزالة المعلومات الخاصة، إلا أن هناك خطرًا يتعلق بتعزيز التعرض للبيانات الحساسة من خلال دمجها في بيانات التدريب. ولذلك، تم اقتراح نهج جديد يحمل عنوان "الانهيار الجزئي للنموذج" (Partial Model Collapse - PMC).

يستند هذا النهج إلى ملاحظات حديثة تشير إلى أن التدريب على التوليد الذاتي للنماذج يؤدي إلى انهيار في التوزيع، مما يساعد في إزالة المعلومات من نواتج النموذج. الفكرة المركزية هنا هي أنه يمكن الاستفادة من انهيار النموذج من خلال تحفيزه عمدًا للبيانات التي نرغب في إزالتها.

أظهرت الأبحاث النظرية والعملية أن هذا الأسلوب يتغلب على القيود التي تواجه طرق إزالة التعلم الحالية، مما يضمن إزالة فعالة للمعلومات الخاصة من مخرجات النموذج، مع الحفاظ على القدرة العامة للنموذج.

يمثل هذا التطور خطوة هامة نحو تطبيق أكثر شمولية في إزالة المعلومات التي تتماشى بشكل أفضل مع متطلبات الخصوصية في العالم الحقيقي. كما تم توفير الشيفرة المصدرية لهذه الأبحاث للمختصين والمطورين للاطلاع عليها واستخدامها في مشاريعهم المستقبلية.