في عصر تظهر فيه نماذج اللغات الضخمة (LLMs) كمحركات رئيسية تكتسب مهارات متزايدة، نجد أن مشكلات الأمان لا تزال تواجه هذه التقنية. تكشف دراسة جديدة عن فجوة حقيقية بين ما يمكن لوكلاء الذكاء الاصطناعي فعله وما ينبغي عليهم القيام به، خاصة عند انخراطهم في تفاعلات متعددة باستخدام أدوات متنوعة.
تتزايد المخاطر بشكل كبير عند استخدام الوكلاء للأدوات وتنفيذ مهام ذات عدة دورات متتالية، الأمر الذي يتطلب تقييم أمان أكثر دقة وفاعلية. ولتسليط الضوء على هذه القضايا، تم تقديم نظام تصنيف جديد يحول المهام الضارة ذات الدورة الواحدة إلى تسلسل هجمات متعددة الدوران، مما يساعد على تقييم فعالية الأمان.
خلال البحث، تم تطوير معيار جديد يُعرف بـ MT-AgentRisk (معيار مخاطر الوكلاء في التفاعلات المتعددة) وهو الأول من نوعه الذي يقيّم أمان الوكلاء في سيناريوهات استخدام الأدوات المتعددة. وقد أظهرت التجارب أن خطر الأمان قد تزايد بنسبة 16% في المعدل العام بين النماذج المفتوحة والمغلقة في هذه التفاعلات.
ولإغلاق هذه الفجوة، يقدّم الباحثون أداة مبتكرة تُسمى ToolShield. تعمل هذه الأداة على تعزيز سلامة الوكلاء دون إلزامهم بتدريب مسبق، حيث تتولى مهمة استكشاف الأدوات الجديدة بشكل تلقائي. عند مواجهة أداة جديدة، يقوم الوكيل بإنشاء حالات اختبار مستقلة، وتنفيذها لرصد الآثار المترتبة، وتخزين تجارب السلامة لاستخدامها في المستقبل.
أظهرت التجارب أن ToolShield تُقلل بشكل فعّال من معدل نجاح الهجمات بنسبة 30% في التفاعلات المتعددة، مما يعزز فقدان الأمان في عمليات التفاعل الأكثر تعقيداً.
هذه الاكتشافات تطرح تساؤلات مهمة حول كيفية مواءمة قدرات الذكاء الاصطناعي مع معايير الأمان المطلوبة، مما يدفعنا للتفكير في الدور المستقبلي لهذه التكنولوجيا.
مخاطر جديدة في تفاعلات متعددة: كيف نضمن أمان الوكلاء باستخدام الأدوات؟
تتسارع قدرة الوكلاء المعتمدين على نماذج اللغات الضخمة (LLMs)، لكن الأمان لا يزال متأخراً. تقدم دراسة جديدة نظام تصنيف يهدف إلى تحسين سلامة التفاعلات المتعددة عبر أدوات متنوعة.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
