تراجع الحوكمة: كيف تؤدي عملية ضغط السياق إلى فقدان قيود السلامة في نماذج LLM طويلة الأمد

Q: ما هو موضوع مقال "تراجع الحوكمة: كيف تؤدي عملية ضغط السياق إلى فقدان قيود السلامة في نماذج LLM طويلة الأمد"؟

يتناول المقال بالتفصيل والتحليل آخر الأخبار والتطورات المتعلقة بـ "تراجع الحوكمة: كيف تؤدي عملية ضغط السياق إلى فقدان قيود السلامة في نماذج LLM طويلة الأمد" في عالم الذكاء الاصطناعي والتكنولوجيا الناشئة.

تتزايد في الآونة الأخيرة الاعتماديات على نماذج اللغة الكبيرة (LLMs) التي تواكب التحديات التقنية في إدارة السياقات طويلة الأمد. تعد عملية ضغط السياق (Context Compaction) إحدى الأدوات الحيوية التي تسهم في اختصار المحتوى والحفاظ على جلسات العمل ضمن ميزانية الرموز (Token Budget). ومع ذلك، أبرزت دراسة جديدة تعرض هذه العملية كواجهة حرجة للسلامة، حيث أن قيود الحوكمة (Governance Constraints) التي تلتزم بها النماذج عندما تكون مرئية قد تُحذف بشكل صامت نتيجة لعمليات الضغط، مما يؤدي إلى تنفيذ أفعال غير مسموحة خلال الجلسات المستمرة.

أطلق الباحثون على هذا النوع من الفشل مصطلح "تراجع الحوكمة" (Governance Decay). قدموا بنية معيارية جديدة تُسمى "ConstraintRot" تتعامل مع سيناريوهات الوكلاء الطويلة الأمد مع تقييم دقيق لعمليات استدعاء الأدوات. تبيّن أن انتهاكات الحوكمة ترتفع بمعدل مفزع، حيث ازداد معدل الانتهاكات من 0% عندما تكون السياسة في السياق الكامل إلى 30% بعد الضغط، وصولاً إلى 59% في بعض النماذج.

كما استعرضوا هجوم إخلاء الضغط (Compaction-Eviction Attack) الذي يستغل المحتوى العدائي لتوجيه الملخص ليتجاهل سياسة مشروعة، ونجحوا في تفكيك كل نموذج تم تقييمه باستخدام حقن محسّنة. كحل لهذا التحدي، اقترح الباحثون "Constraint Pinning"، وهي طريقة بسيطة لا تتطلب تدريبًا تهدف إلى عزل قيود الحوكمة عن ضغط السياق الضار، حيث يعود معدل الانتهاكات إلى 0% في اختبارهم.

هذه النتائج تشير إلى ضرورة إعادة التفكير في إدارة السياق كواجهة حوكمة مهمة لوكلاء نماذج اللغة الكبيرة المفعلة.

تراجع الحوكمة: كيف تؤدي عملية ضغط السياق إلى فقدان قيود السلامة في نماذج LLM طويلة الأمد

شارك الخبر مع أصدقائك

📰أخبار قد تهمك

اكتشف برنامج مكافآت خطورة OpenAI: درع الأمان ضد مخاطر الذكاء الاصطناعي!

تعزيز أمان الذكاء الاصطناعي: سياسات جديدة لحماية المراهقين في عالم البرمجة

سورا 2: منصة إبداعية آمنة لتجاوز تحديات الأمان الرقمي!