في ظل التطورات السريعة في تكنولوجيا الذكاء الاصطناعي، تظهر التحديات باستمرار، ومن بينها هجمات استنزاف توكنات التفكير (Reasoning-Token Consumption Attacks) التي تهدد أداء نماذج اللغات الكبيرة (Large Language Models). تمثل هذه الهجمات محاولة لتوجيه موارد النماذج عن طريق إدخال مهام خادعة، مما يتسبب في انقطاع الخدمة عندما لا تتمكن النماذج من تقديم إجابات نهائية.

للتصدي لهذا التحدي، تم تطوير RecurGuard، وهو نظام مراقبة ذكي يعمل في الوقت الفعلي للكشف عن هجمات استنزاف توكنات التفكير. يهدف RecurGuard إلى تتبع وتحليل آثار التفكير (Reasoning Traces) بينما تُنتجها النماذج، من خلال رصد ثلاثة مؤشرات رئيسية: معدل التكرار (Recurrence Rate)، نمو الحجم (Volume Growth)، والتقدم نحو استجابة المستخدم (Progress Toward User Query).

إذا كانت المؤشرات الثلاثة غير طبيعية عبر ثلاثة أجزاء متتالية، يقوم RecurGuard بإيقاف عملية الإنتاج مبكرًا، مما يمنع الاستنزاف غير الضروري للموارد. خلال تقييم فعاليات النظام، أظهر RecurGuard قدرة مذهلة على اكتشاف 99% من هجمات OverThink و92% من حالات ExtendAttack، مع الاحتفاظ بمعدلات منخفضة للغاية من الإيجابيات الكاذبة في مجالات مثل الإجابة على الأسئلة (Question Answering) وتوليد الأكواد (Code Generation) والرياضيات وتلخيص المحتوى (Summarization).

أظهرت الاختبارات الديناميكية (Adaptive Evaluation) أيضًا حدود الدفاع، حيث تُبقي الهجمات الموضعية (Topical Attacks) على تضخيم يصل إلى 11.9 مرة مع معدل فقد مشترك يقارب 50%. في حالة عدم توافر آثار التفكير، يوفر نموذج QDM نظام مراقبة احتياطي يعتمد على المخرجات النهائية.

يُعتبر RecurGuard خطوة قوية نحو تعزيز أمان وفاعلية نماذج الذكاء الاصطناعي، مما يمكّن هذه الأنظمة من استخدام مواردها بكفاءة وتقديم أفضل أداء ممكن. كيف ترى تأثير هذه التقنية على أمان نماذج اللغات الكبيرة؟ شاركونا آراءكم في التعليقات!