تعد نماذج اللغة متعددة الأنماط (Multimodal Large Language Models - MLLMs) من أبرز التطورات في عالم الذكاء الاصطناعي، حيث تتمتع بقدرة مذهلة على معالجة المعلومات الهيكلية. إلا أن هذه النماذج تعاني من مشكلة خطيرة تُعرف بالحمل المعرفي الهيكلي (Structural Cognitive Overload - SCO)، مما يؤثر على تماسكها المنطقي ويعرض أمانها للخطر.

تظهر الأبحاث أن الحمل المعرفي الهيكلي هو نتيجة للصراع بين القدرة على التفكير العميق وتوافق الأمان، وهي مشكلة لم تحظَ بعد بالتحليل الكافي. لتسليط الضوء على هذا المفهوم، تم تقديم إطار عمل جديد يسمى StructBreak، والذي يعمل بشكل آلي وغير متوقف على الوصول إلى النماذج الداخلية.

يتيح StructBreak قياس SCO ويكشف عن نمط جديد من الهجمات المعرفية، حيث أظهرت التقييمات التجريبية على ستة نماذج رائدة أن SCO يمكن أن يؤدي إلى توليد محتوى سام بنسبة تصل إلى 92% (وحتى 97% في نموذج Gemini 2.5).

كما أن البحث يشمل تحليل ديناميات الانتباه وتضاريس الفضاء الكامن، مما يظهر كيف يمكن لإطار StructBreak أن يساعد في تجاوز فلاتر الأمان الحالية. ومن المهم ملاحظة أن فعالية آليات الأمان التقليدية لا تكفي لمواجهة التحديات التي تطرحها نماذج التفكير المعقد متعددة الأنماط.

يمكن أن تؤدي هذه الاكتشافات إلى تحسينات كبيرة في الأمان وموثوقية التطبيقات التي تعتمد على الذكاء الاصطناعي، مما يبرز الحاجة الملحة لمواكبة التطورات التقنية.