تتزايد في الآونة الأخيرة الاعتماديات على نماذج اللغة الكبيرة (LLMs) التي تواكب التحديات التقنية في إدارة السياقات طويلة الأمد. تعد عملية ضغط السياق (Context Compaction) إحدى الأدوات الحيوية التي تسهم في اختصار المحتوى والحفاظ على جلسات العمل ضمن ميزانية الرموز (Token Budget). ومع ذلك، أبرزت دراسة جديدة تعرض هذه العملية كواجهة حرجة للسلامة، حيث أن قيود الحوكمة (Governance Constraints) التي تلتزم بها النماذج عندما تكون مرئية قد تُحذف بشكل صامت نتيجة لعمليات الضغط، مما يؤدي إلى تنفيذ أفعال غير مسموحة خلال الجلسات المستمرة.

أطلق الباحثون على هذا النوع من الفشل مصطلح "تراجع الحوكمة" (Governance Decay). قدموا بنية معيارية جديدة تُسمى "ConstraintRot" تتعامل مع سيناريوهات الوكلاء الطويلة الأمد مع تقييم دقيق لعمليات استدعاء الأدوات. تبيّن أن انتهاكات الحوكمة ترتفع بمعدل مفزع، حيث ازداد معدل الانتهاكات من 0% عندما تكون السياسة في السياق الكامل إلى 30% بعد الضغط، وصولاً إلى 59% في بعض النماذج.

كما استعرضوا هجوم إخلاء الضغط (Compaction-Eviction Attack) الذي يستغل المحتوى العدائي لتوجيه الملخص ليتجاهل سياسة مشروعة، ونجحوا في تفكيك كل نموذج تم تقييمه باستخدام حقن محسّنة. كحل لهذا التحدي، اقترح الباحثون "Constraint Pinning"، وهي طريقة بسيطة لا تتطلب تدريبًا تهدف إلى عزل قيود الحوكمة عن ضغط السياق الضار، حيث يعود معدل الانتهاكات إلى 0% في اختبارهم.

هذه النتائج تشير إلى ضرورة إعادة التفكير في إدارة السياق كواجهة حوكمة مهمة لوكلاء نماذج اللغة الكبيرة المفعلة.