في عالم [تقنيات](/tag/تقنيات) الذكاء الاصطناعي، تبرز [نماذج الانتشار](/tag/[نماذج](/tag/نماذج)-[الانتشار](/tag/الانتشار)) (Diffusion [Models](/tag/models)) كقوة هائلة في [توليد [الصور](/tag/الصور) من النصوص](/tag/[توليد](/tag/توليد)-[الصور](/tag/الصور)-من-النصوص). ولكن، هذه القدرات الهائلة تأتي مع قلق كبير بشأن المحتوى غير الآمن أو غير المرغوب فيه. هنا يأتي مفهوم الإزالة (Concept Erasure) كحل محتمل للحد من تلك [المخاطر](/tag/المخاطر) من خلال حذف [مفاهيم](/tag/مفاهيم) محددة من [النماذج](/tag/النماذج) المدربة مسبقًا.
ومع ذلك، كشفت [دراسات](/tag/دراسات) حديثة أن تلك الطرق غالبًا ما تقمع المفاهيم بدلاً من [القضاء](/tag/القضاء) عليها بالكامل، مما يبقي [النماذج](/tag/النماذج) عرضة لهجمات الاستيقاظ. معظم الأساليب المعمول بها تعتمد بشكل أساسي على الوصول [عبر](/tag/عبر) [أدوات](/tag/أدوات) [التحسين](/tag/التحسين) أو التراجع، بينما تظل فكرة الاستيقاظ تحت [قيود](/tag/قيود) النموذج الأسود غير مستكشفة بشكل كافٍ.
في هذه [الدراسة](/tag/الدراسة) الجديدة، نعيد النظر في عملية [إزالة الضوضاء](/tag/إزالة-الضوضاء) من منظور المسار، ونظهر أن الإزالة تؤدي بشكل أساسي إلى تعطيل [توافق](/tag/توافق) النص والمعاني في المراحل الأولية، لكنها لا تمنع تمامًا انتقال [المعلومات](/tag/المعلومات) الدلالية [عبر](/tag/عبر) [ديناميات](/tag/ديناميات) [إزالة الضوضاء](/tag/إزالة-الضوضاء). كلما تقدم التوليد، تعتمد [النماذج](/tag/النماذج) بشكل متزايد على الحالة الضوضائية المتطورة بدلاً من الشروط النصية، مما يخلق فرصة لتجاوز [العلاقات](/tag/العلاقات) المحذوفة.
استجابةً لهذه الملاحظة، نقدم إطار [عمل](/tag/عمل) [جديد](/tag/جديد) يسمى ConceptAgent، وهو إطار متعدد [الوكلاء](/tag/الوكلاء) يعمل بدون [تدريب](/tag/تدريب) يوقظ المفاهيم المحذوفة من خلال بدء مسار [إزالة الضوضاء](/tag/إزالة-الضوضاء) من حالات ضوضائية موجهة بديلة. [التجارب](/tag/التجارب) الواسعة تُظهر أن ConceptAgent يمكّن من استيقاظ دقيق وقابل للتحكم للمفاهيم المحذوفة تحت إعدادات النموذج الأسود، دون الحاجة للوصول إلى معلمات النموذج أو [التدرجات](/tag/التدرجات) أو التمثيلات الداخلية. هذه النتائج تبرز [القيود](/tag/القيود) الأساسية للطرق الحالية لإزالة المفاهيم وتوفر [رؤى](/tag/رؤى) جديدة حول الطبيعة الديناميكية للسيطرة الدلالية في [نماذج الانتشار](/tag/[نماذج](/tag/نماذج)-[الانتشار](/tag/الانتشار)).
استكشاف المفاهيم المدفونة: اختراقات مفاجئة عبر أطر متعددة الوكلاء!
تمتاز نماذج الانتشار بقدراتها الكبيرة في توليد الصور، لكن تهددها مخاطر المحتوى غير الآمن. تقدم دراسة جديدة إطارًا ثوريًا لتجاوز القيود والتغلب على ضعف مفهوم الإزالة.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
