في عالم تقنيات الذكاء الاصطناعي، تبرز نماذج الانتشار (Diffusion Models) كقوة هائلة في توليد الصور من النصوص. ولكن، هذه القدرات الهائلة تأتي مع قلق كبير بشأن المحتوى غير الآمن أو غير المرغوب فيه. هنا يأتي مفهوم الإزالة (Concept Erasure) كحل محتمل للحد من تلك المخاطر من خلال حذف مفاهيم محددة من النماذج المدربة مسبقًا.

ومع ذلك، كشفت دراسات حديثة أن تلك الطرق غالبًا ما تقمع المفاهيم بدلاً من القضاء عليها بالكامل، مما يبقي النماذج عرضة لهجمات الاستيقاظ. معظم الأساليب المعمول بها تعتمد بشكل أساسي على الوصول عبر أدوات التحسين أو التراجع، بينما تظل فكرة الاستيقاظ تحت قيود النموذج الأسود غير مستكشفة بشكل كافٍ.

في هذه الدراسة الجديدة، نعيد النظر في عملية إزالة الضوضاء من منظور المسار، ونظهر أن الإزالة تؤدي بشكل أساسي إلى تعطيل توافق النص والمعاني في المراحل الأولية، لكنها لا تمنع تمامًا انتقال المعلومات الدلالية عبر ديناميات إزالة الضوضاء. كلما تقدم التوليد، تعتمد النماذج بشكل متزايد على الحالة الضوضائية المتطورة بدلاً من الشروط النصية، مما يخلق فرصة لتجاوز العلاقات المحذوفة.

استجابةً لهذه الملاحظة، نقدم إطار عمل جديد يسمى ConceptAgent، وهو إطار متعدد الوكلاء يعمل بدون تدريب يوقظ المفاهيم المحذوفة من خلال بدء مسار إزالة الضوضاء من حالات ضوضائية موجهة بديلة. التجارب الواسعة تُظهر أن ConceptAgent يمكّن من استيقاظ دقيق وقابل للتحكم للمفاهيم المحذوفة تحت إعدادات النموذج الأسود، دون الحاجة للوصول إلى معلمات النموذج أو التدرجات أو التمثيلات الداخلية. هذه النتائج تبرز القيود الأساسية للطرق الحالية لإزالة المفاهيم وتوفر رؤى جديدة حول الطبيعة الديناميكية للسيطرة الدلالية في نماذج الانتشار.