في عصر تتزايد فيه أهمية الذكاء الاصطناعي (AI) في مجالات متعددة، أصبح نسيان المعلومات جزءاً مهماً من نماذج الانتشار النصية إلى الصور. أظهرت الأبحاث الأخيرة أن هذه النماذج تحتاج إلى استراتيجيات فعالة لترك المعلومات غير المطلوبة تنتمي إلى حقوق الطبع والنشر، أو لرغبات الفنانين، دون الحاجة إلى إعادة تدريب كامل. هنا يأتي دور النموذج الثوري الجديد، المعروف باسم SurgUn.

تحدي رئيسي يواجه النماذج الحالية هو عدم التوازن بين القدرة على الحذف والاحتفاظ بالمعلومات. حيث تؤدي التحديثات العدوانية إلى حذف الأهداف، لكن قد تضر بالقدرات المشتركة. بينما تحافظ التحديثات التقليدية على الجودة، فإنها قد تترك المفاهيم قابلة للاسترداد عن طريق تقنيات مثل العبارات المقاربة أو التحريضية.

استلهم فريق الباحثين من مفهوم التداخل الرجعي (retroactive interference) لتطوير SurgUn، الذي ينظر إلى النسيان كتنافس مدروس بدلاً من حذفه بشكل مباشر. يعتمد هذا النموذج على المنافسة بين التدرجات، مما يسمح بضعف التدرج المستهدف في سلوك إزالة الضوضاء أو التطابق مع التدفق.

تكمن الفكرة في إضافة مجموعة من المشتتات اللفظية، مما ينشئ مسارات غير مستهدفة في سياق نفس الدعوة، وبالتالي يعيد توزيع النتائج عبر أنماط متعددة بدلاً من الانهيار إلى بروفايل واحد. وللحد من النسيان الجانبي من خلال المسارات المشتركة، يضيف SurgUn تقنية توطين الوزن المتجذر في البكسل، مما يتيح تحديد مناطق الانتباه بناءً على سلوك الإزالة والاحتفاظ.

أظهرت التجارب على نماذج مثل Stable Diffusion v1.5 وSDXL وSANA-1.5 أن SurgUn يحقق توازناً أفضل في الحذف والاحتفاظ مقارنة بالنماذج الأساسية. كما أثبتت التجارب أن استخدام مشتتات متنوعة والاعتماد على المنافسة التباينية أمران ضروريان للحفاظ على التوازن بين الحذف والاحتفاظ بالمفاهيم ذات الصلة وغير ذات الصلة.

ببساطة، يعد SurgUn خطوة هائلة نحو فهم وابتكار طرق جديدة لتحسين نماذج الذكاء الاصطناعي في معالجة المعلومات. ما رأيكم في هذا التطور؟ شاركونا في التعليقات.