في عالم الذكاء الاصطناعي المتقدم، أصبحت الوكالات المعتمدة على نماذج اللغات الضخمة (Large Language Models) تتولى مهام متعددة بفاعلية وسرعة. إلا أن هذه التقنية الرائدة تأتي مع تحديات تتعلق بالخصوصية، حيث أثبتت الدراسات أنها قد تجمع معلومات حساسة أكثر من تلك المطلوبة لإنجاز المهام.

هنا يبرز دور PrivacyPeek، وهو معيار جديد يهدف إلى تقييم تسريبات الخصوصية خلال مرحلة جمع البيانات. بينما تركز المعايير الحالية على ما يتم الكشف عنه في ردود الوكالات، تتجاوز PrivacyPeek هذا الأمر لتجري تقييمًا كاملاً لعمليات جمع البيانات. هذا الابتكار يمثل خطوة كبيرة نحو تفهم أعمق لمشكلات الخصوصية المرتبطة بالذكاء الاصطناعي.

يقدم PrivacyPeek 1,182 حالة عبر 7 سلوكيات جمع و16 مجال تطبيق. من خلال تحليلات دقيقة، تتبع "فحص الجمع" (Acquisition Inspection) مسار استدعاء الأدوات التي تستخدمها الوكالة، مما يمكنها من الكشف عن أي معلومات حساسة تم جمعها عن غير قصد. علاوة على ذلك، يقدم "استفسار القرصنة" (Probe Elicitation) آلية لقياس مدى سهولة استهداف تلك المعلومات من قبل المخترقين.

تظهر التجارب التي أجريت على 10 وكالات مبنية على نماذج لغوية مختلفة أن تسرب المعلومات الحساسة يعد شائعًا بشكل مقلق. بالإضافة إلى ذلك، لوحظت علاقة بين قدرة الوكالة على إكمال المهام ودرجة تسرب المعلومات في مرحلة الجمع. ورغم وجود دفاعات على مستوى السلوكيات، إلا أنها قد تقلل فقط جزءًا ضئيلًا من تسريب البيانات، مما يجعل الأمر أكثر إلحاحًا لحماية خصوصية المستخدمين.

إن النتائج التي توصل إليها التقنيون تجعل من التدقيق في تسريبات الخصوصية خلال مرحلة الجمع أمرًا ضروريًا. يمكنكم الاطلاع على مجموعة البيانات والشفرة المستخدمة على الرابط المرفق. ما هي آراؤكم حول إحدى أبرز قضايا الخصوصية في العصر الرقمي؟ شاركونا في التعليقات!