في عصر يفوق فيه الاعتماد على [النماذج اللغوية الضخمة](/tag/[النماذج](/tag/النماذج)-اللغوية-الضخمة) (Large Language [Models](/tag/models))، أصبح من الضروري [فهم](/tag/فهم) مدى قدرتها على [حماية](/tag/حماية) بياناتنا الخاصة. تدخل [أداة](/tag/أداة) [POLAR-Bench](/tag/polar-bench) (Policy-aware adversarial Benchmark) لتعالج هذه التحديات من خلال الكشف عن توازن [الخصوصية](/tag/الخصوصية) والفائدة.
تُظهر [الأبحاث](/tag/الأبحاث) أن [الوكلاء](/tag/الوكلاء) القائمين على هذه [النماذج](/tag/النماذج) يمكنهم الوصول إلى [بيانات المستخدمين](/tag/[بيانات](/tag/بيانات)-المستخدمين) الخاصة والتفاعل مع [أنظمة](/tag/أنظمة) خارجية بناءً على [نوايا المستخدم](/tag/[نوايا](/tag/نوايا)-المستخدم). المستخدم يحدد ما يمكن وما يجب عدم مشاركته، ويتعين على الوكيل [الالتزام](/tag/الالتزام) بذلك حتى في مواجهة الأنظمة التي قد تتصرف بشكل عدائي.
تتضمن [POLAR-Bench](/tag/polar-bench) آلية حوارية تجمع بين [نموذج](/tag/نموذج) موثوق مزود بسياسة [خصوصية](/tag/خصوصية) ومهمة، ونموذج خارجي يستفز لجمع [معلومات](/tag/معلومات) تتعلق بالمهمة والبيانات المحمية. من خلال [تحليل بيانات](/tag/[تحليل](/tag/تحليل)-[بيانات](/tag/بيانات)) من 10 مجالات مختلفة تشمل أكثر من 7,852 عينة، [تمكن](/tag/تمكن) الباحثون من [تقييم](/tag/تقييم) [الخصوصية](/tag/الخصوصية) والفائدة على أساس مجموعة من [المعايير](/tag/المعايير).
وقد أظهرت النتائج وجود فجوة واضحة بين [النماذج](/tag/النماذج) المتقدمة، حيث يمكن أن تمتنع تلك [النماذج](/tag/النماذج) عن الكشف عن أكثر من 99% من السمات المحمية. في المقابل، [النماذج](/tag/النماذج) ذات الأوزان المفتوحة في نطاق 1-30 مليار، والتي غالبًا ما يستخدمها المستخدمون كوكيل موثوق، سجلت نتائج ضعيفة، حيث كانت الأدنى تعرضًا لكشف [البيانات](/tag/البيانات) بنسبة تفوق الـ 50%.
تساعد [POLAR-Bench](/tag/polar-bench) على تحديد النقاط الحرجة في [النماذج](/tag/النماذج) حيث يحدث انقطاع في اتباع النوايا، مما يوفر فرصة لتوجيه [الخصوصية](/tag/الخصوصية) في الاتجاه الصحيح وإجراء [تحسينات](/tag/تحسينات) تحتاجها [النماذج](/tag/النماذج) لضمان [حماية](/tag/حماية) [بيانات المستخدمين](/tag/[بيانات](/tag/بيانات)-المستخدمين).
POLAR-Bench: معيار تشخيصي للكشف عن علاقات الخصوصية والفائدة في نماذج الذكاء الاصطناعي
تمكننا أداة POLAR-Bench من قياس مدى التوازن بين الخصوصية والفائدة في نماذج الذكاء الاصطناعي. تكشف النتائج عن تباين كبير في أداء النماذج عند التعامل مع البيانات الحساسة.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
