في الأعوام الأخيرة، شهدنا تحولاً لافتاً في دور وكلاء نماذج اللغات الضخمة (LLM) من كونها مجرد دردشات إلى أدوات فاعلة في بيئات العمل الحقيقية. حيث يمكن لهذه النماذج قراءة وكتابة الملفات، واستدعاء الأدوات، وإعادة استخدام حالة العمل عبر الجلسات المختلفة. ومع هذه القدرات الجديدة، يظهر تهديد غير مسبوق يتمثل في تعرض هذه الأنظمة لهجمات جديدة.

الهجمات المعروفة باسم "حقن التعليمات" (Prompt Injection) تتيح للمهاجمين إمكانية إدخال تعليمات خفية ضمن ملفات أو مخرجات أدوات، مما يجعل الوكلاء يستطيعون قراءتها وتخزينها، وتنفيذها لاحقًا. هذه الهجمات متعددة الخطوات تبدو غير ضارة في كل مرحلة على حدة، لكنها قد تتجمع لتتحول إلى محتوى يتيح سيطرة دائمة.

للرد على هذا التهديد، تم تقديم معيار ClawTrojan، الذي يُعد أداة للكشف عن هجمات التروجان المتعددة الخطوات في البيئات المحلية. في مساحة العمل المعاد إنشاؤها باستخدام GPT-5.4، حقق ClawTrojan معدل نجاح هجوم بلغ 95.5%، بينما كانت الهجمات التقليدية تنتج معدلات نجاح قريبة من الصفر.

لحماية الأنظمة من هذا التهديد، نقترح حلول DASGuard التي تفحص النصوص المشبوهة في الملفات المحلية الحساسة، وتتبع مصدرها، وتزيل المحتوى الضار الذي لا ينتمي إلى مصدر موثوق. أما النتائج، فتُظهر أن DASGuard يحقق دفاعاً ديناميكياً فعالاً من خلال دمج استراتيجيات الحجب مع التعديلات النظيفة في بيئة العمل.

هذا التطور التقني يقدم رؤية جديدة حول كيفية حماية أدوات الذكاء الاصطناعي من مخاطر الهجمات المعقدة، ويؤكد على أهمية تفعيل آليات الدفاع الفعالة لحماية بيئات العمل الحديثة.