تواجه وكالات نماذج اللغات الضخمة (LLM) تحديات أمان مزدوجة تتعلق بإجراءات غير مصرح بها وكشف المعلومات الحساسة. تقنيات الدفاع الحالية تركز عادةً على حدود واحدة فقط، مما يعرض النظام لخطر الهجمات.

هنا يأتي دور SecureClaw، وهي بنية معمارية مبتكرة تهدف إلى تحقيق أمان مزدوج. فكر في SecureClaw كنظام دفاع قوي يدير كل من حدود التخطيط (planner/runtime) ومخرجات الأفعال (action sink) بكفاءة.

تُعالج المعلومات الحساسة من خلال بوابة موثوقة تقوم باستبدال القيم الخام بمقابض غير شفافة. كما أنها تستخدم بروتوكول PREVIEW→COMMIT لتحكم دقيق في العمليات التي تؤثر على الحالة الخارجية، مما يضمن أن فقط المنفذ الموثوق يمكنه تنفيذ الطلبات المصرح بها. خلال التطويرات التجريبية، أثبتت SecureClaw قدرتها الفائقة حيث سجلت نسبة نجاح صفر في هجمات ASB، و0.64٪ في AgentDojo، و3.23٪ في AgentLeak.

يعكس هذا الابتكار قدرة SecureClaw على الحفاظ على سلامة المعلومات الحساسة بالإضافة إلى ضمان فعالية المهام، مما يجعلها الخيار الأمثل لحماية وكالات نماذج اللغات الضخمة.