في ظل التقدم الكبير في استخدام الوكالات المدعومة بنماذج لغوية ضخمة (LLM) لأداء مهام حقيقية ومعقدة، تزايدت التهديدات التي تواجهها هذه الوكالات. تتمثل هذه التهديدات في محاولات خبيثة تستغل التفاعلات الممتدة بين المستخدم والوكيل والبيئة لتحقيق أهداف مشبوهة، وهو ما قد يؤدي إلى نتائج كارثية في المجالات الحساسة.
لذا، تم تقديم نظام MAGE (الذاكرة كوسيلة لتنفيذ القيود) كإطار دفاعي مبتكر. يستلهم MAGE من مفهوم "الكومة الظليلة" في أمان الأنظمة، حيث يحتفظ بذاكرة وكيل مخصصة تركز على السلامة، تستخلص وتحتفظ بالسياقات الحرجة لضمان التنفيذ الآمن للمهام.
تعمل هذه الذاكرة الظليلة على تقييم مخاطر الأفعال المعلقة قبل تنفيذها، مما يعزز قدرة النظام على الكشف المبكر عن التهديدات والاستجابة لها. وقد أظهرت التقييمات الشاملة أن MAGE يتفوق بشكل ملحوظ على الدفاعات الحالية في دقة الكشف، حيث يحقق كشفًا مبكرًا لمعظم الهجمات، مما يضيف فقط عبئًا طفيفًا على فائدة الوكيل.
علاوة على ذلك، يُعد MAGE أول إطار عمل يستخدم مقاربة الذاكرة الوكيلة للكشف والتخفيف من التهديدات بعيدة المدى، مما يفتح آفاقًا جديدة للبحث المستقبلي في هذا المجال الحيوي.
MAGE: حماية وكالات النماذج اللغوية من التهديدات بعيدة المدى عبر الذاكرة الظليلة!
تقدم MAGE إطارًا دفاعيًا مبتكرًا لحماية الوكالات المدعومة بنماذج لغوية ضخمة (LLM) من تهديدات بعيدة المدى. يعتمد هذا النظام على إنشاء ذاكرة خاصة تضمن اتخاذ قرارات آمنة وفعّالة.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
