في عالم الذكاء الاصطناعي، تُعد تدفقات التصحيح (Rectified Flows) من النماذج المتطورة التي تُستخدم في أنظمة توليد المحتوى. لكن تبقى مسألة ما تحتفظ به هذه النماذج من بيانات التدريب غامضة، حيث يمكن أن تؤثر على حقوق الطبع والنشر والخصوصية.

من خلال دراسة جديدة نُشرت في arXiv، تم استكشاف المظاهر الدقيقة التي يمكن أن تخزنها هذه النماذج من البيانات التي تم تدريبها عليها. الباحثون أجروا تحليلاً لمسار الاستيفاء (Interpolation Path) الذي يُعرف تدفقات التصحيح، ووجدوا أن هناك فجوة بين إعادة بناء بيانات التدريب وبيانات الاختبار، تتخذ شكل منحنى جرس عند تغير المتغير 𝜆.

هذه النتائج تشير إلى أن الفجوة تتزايد أثناء التدريب، بينما تظل مقاييس التقييم مستقرة. وقد تمكن الباحثون من اشتقاق موقع ذروة هذه الإشارة بشكل مغلق تحت افتراضات غاوسية، مما يبرز الطبيعة العامة للهيكل الجرس المتعلق بهذه الإشارات.

ليس هذا فحسب، بل تم أيضًا التحقق من هذه النتائج على كل من البيانات الصوتية والصور، مشيرين إلى أن الهيكل الجرس متواجد بشكل عالمي. يُمكن استخدام هذه المعلومات لشن هجمات استنتاج العضوية (Membership Inference Attack) التي تُميز بين أعضاء مجموعة التدريب وغير الأعضاء، مما يبرز أهمية تحسينات الخصوصية في نماذج الذكاء الاصطناعي.

هل تعتقد أن الوعي بالخصوصية في نماذج الذكاء الاصطناعي كافٍ؟ شاركونا آراءكم في التعليقات!