في عالم [تقنيات](/tag/تقنيات) الذكاء الاصطناعي، تبرز [نماذج الانتشار](/tag/[نماذج](/tag/نماذج)-[الانتشار](/tag/الانتشار)) (Diffusion [Models](/tag/models)) كقوة هائلة في [توليد [الصور](/tag/الصور) من النصوص](/tag/[توليد](/tag/توليد)-[الصور](/tag/الصور)-من-النصوص). ولكن، هذه القدرات الهائلة تأتي مع قلق كبير بشأن المحتوى غير الآمن أو غير المرغوب فيه. هنا يأتي مفهوم الإزالة (Concept Erasure) كحل محتمل للحد من تلك [المخاطر](/tag/المخاطر) من خلال حذف [مفاهيم](/tag/مفاهيم) محددة من [النماذج](/tag/النماذج) المدربة مسبقًا.

ومع ذلك، كشفت [دراسات](/tag/دراسات) حديثة أن تلك الطرق غالبًا ما تقمع المفاهيم بدلاً من [القضاء](/tag/القضاء) عليها بالكامل، مما يبقي [النماذج](/tag/النماذج) عرضة لهجمات الاستيقاظ. معظم الأساليب المعمول بها تعتمد بشكل أساسي على الوصول [عبر](/tag/عبر) [أدوات](/tag/أدوات) [التحسين](/tag/التحسين) أو التراجع، بينما تظل فكرة الاستيقاظ تحت [قيود](/tag/قيود) النموذج الأسود غير مستكشفة بشكل كافٍ.

في هذه [الدراسة](/tag/الدراسة) الجديدة، نعيد النظر في عملية [إزالة الضوضاء](/tag/إزالة-الضوضاء) من منظور المسار، ونظهر أن الإزالة تؤدي بشكل أساسي إلى تعطيل [توافق](/tag/توافق) النص والمعاني في المراحل الأولية، لكنها لا تمنع تمامًا انتقال [المعلومات](/tag/المعلومات) الدلالية [عبر](/tag/عبر) [ديناميات](/tag/ديناميات) [إزالة الضوضاء](/tag/إزالة-الضوضاء). كلما تقدم التوليد، تعتمد [النماذج](/tag/النماذج) بشكل متزايد على الحالة الضوضائية المتطورة بدلاً من الشروط النصية، مما يخلق فرصة لتجاوز [العلاقات](/tag/العلاقات) المحذوفة.

استجابةً لهذه الملاحظة، نقدم إطار [عمل](/tag/عمل) [جديد](/tag/جديد) يسمى ConceptAgent، وهو إطار متعدد [الوكلاء](/tag/الوكلاء) يعمل بدون [تدريب](/tag/تدريب) يوقظ المفاهيم المحذوفة من خلال بدء مسار [إزالة الضوضاء](/tag/إزالة-الضوضاء) من حالات ضوضائية موجهة بديلة. [التجارب](/tag/التجارب) الواسعة تُظهر أن ConceptAgent يمكّن من استيقاظ دقيق وقابل للتحكم للمفاهيم المحذوفة تحت إعدادات النموذج الأسود، دون الحاجة للوصول إلى معلمات النموذج أو [التدرجات](/tag/التدرجات) أو التمثيلات الداخلية. هذه النتائج تبرز [القيود](/tag/القيود) الأساسية للطرق الحالية لإزالة المفاهيم وتوفر [رؤى](/tag/رؤى) جديدة حول الطبيعة الديناميكية للسيطرة الدلالية في [نماذج الانتشار](/tag/[نماذج](/tag/نماذج)-[الانتشار](/tag/الانتشار)).