في السنوات الأخيرة، أثارت التقدمات في نماذج التوليد، مثل نماذج الانتشار (Diffusion Models)، قلقاً كبيراً بشأن الخصوصية وانتهاك حقوق الطبع والنشر ورعاية البيانات. لفهم هذه المخاطر بشكل أفضل والتحكم فيها، قدمت دراسات سابقة تقنيات وهجمات يمكن استخدامها لإعادة بناء الصور أو أجزاء منها من البيانات التدريبية.

تشير الشواهد إلى أن البيانات التدريبية يمكن استعادتها، لكن الطرق الموجودة غالباً ما تتطلب موارد حسابية عالية أو وصول جزئي إلى مجموعة التدريب، أو موجهات مصممة بعناية. في هذا العمل الجديد، نعرض هجمة جديدة تتطلب موارد قليلة وتفترض عدم وجود وصول أو وصول محدود إلى بيانات التدريب، وتحديد موجهات تبدو غير ضارة يمكن أن تؤدي إلى إعادة بناء صور قد تكون ذات مخاطر.

أحد الاكتشافات المثيرة هو أنه عند استخدام النموذج الموجود، كانت النتيجة لدلالة "قميص أزرق يونيسكس" تظهر وجه شخص حقيقي. من خلال دمج الثغرات المعرّفة مع بيانات موجهات حقيقية، اكتشفنا موجهات تفيد بإعادة إنتاج عناصر بصرية مُحمَّلة في الذاكرة. تستند طريقتنا إلى رؤى من أعمال سابقة وتستخدم المعرفة المتخصصة لكشف ثغرة أساسية ناتجة عن استخدام بيانات التجارة الإلكترونية المسروقة، حيث ترتبط تخطيطات وصور قالبية ارتباطاً وثيقاً بموجهات نصية مشابهة.

لمن يرغب في استكشاف المزيد، الكود لأداتنا متاح للجمهور على الروابط المستندية. هذا الاكتشاف يسلط الضوء على ضرورة تعزيز أمن البيانات في عالم الذكاء الاصطناعي المتطور بشكل سريع.