في عصر تظهر فيه نماذج اللغات الضخمة (LLMs) كمحركات رئيسية تكتسب مهارات متزايدة، نجد أن مشكلات الأمان لا تزال تواجه هذه التقنية. تكشف دراسة جديدة عن فجوة حقيقية بين ما يمكن لوكلاء الذكاء الاصطناعي فعله وما ينبغي عليهم القيام به، خاصة عند انخراطهم في تفاعلات متعددة باستخدام أدوات متنوعة.

تتزايد المخاطر بشكل كبير عند استخدام الوكلاء للأدوات وتنفيذ مهام ذات عدة دورات متتالية، الأمر الذي يتطلب تقييم أمان أكثر دقة وفاعلية. ولتسليط الضوء على هذه القضايا، تم تقديم نظام تصنيف جديد يحول المهام الضارة ذات الدورة الواحدة إلى تسلسل هجمات متعددة الدوران، مما يساعد على تقييم فعالية الأمان.

خلال البحث، تم تطوير معيار جديد يُعرف بـ MT-AgentRisk (معيار مخاطر الوكلاء في التفاعلات المتعددة) وهو الأول من نوعه الذي يقيّم أمان الوكلاء في سيناريوهات استخدام الأدوات المتعددة. وقد أظهرت التجارب أن خطر الأمان قد تزايد بنسبة 16% في المعدل العام بين النماذج المفتوحة والمغلقة في هذه التفاعلات.

ولإغلاق هذه الفجوة، يقدّم الباحثون أداة مبتكرة تُسمى ToolShield. تعمل هذه الأداة على تعزيز سلامة الوكلاء دون إلزامهم بتدريب مسبق، حيث تتولى مهمة استكشاف الأدوات الجديدة بشكل تلقائي. عند مواجهة أداة جديدة، يقوم الوكيل بإنشاء حالات اختبار مستقلة، وتنفيذها لرصد الآثار المترتبة، وتخزين تجارب السلامة لاستخدامها في المستقبل.

أظهرت التجارب أن ToolShield تُقلل بشكل فعّال من معدل نجاح الهجمات بنسبة 30% في التفاعلات المتعددة، مما يعزز فقدان الأمان في عمليات التفاعل الأكثر تعقيداً.

هذه الاكتشافات تطرح تساؤلات مهمة حول كيفية مواءمة قدرات الذكاء الاصطناعي مع معايير الأمان المطلوبة، مما يدفعنا للتفكير في الدور المستقبلي لهذه التكنولوجيا.