في دراسة جديدة تم نشرها على arXiv، تم إثبات أن نماذج اللغة الحديثة ليست فقط أدوات تعتمد على البيانات؛ بل لديها القدرة على الكشف عن التغييرات التي تُجرى على تنشيطها، سواء كانت ضبابية (dropout) أو ضوضاء غاوسية (Gaussian noise).

من خلال التجارب المنهجية، قام الباحثون بتطبيق نوعين من الاضطراب على تنشيط الجمل المستهدفة، حيث تم عرض نموذج الاختيار المتعدد، الذي يتضمن أسئلة مثل: "أي من الجمل السابقة تم اضطرابها؟" أو "أي من الاضطرابات تم تطبيقها؟". وتم اختبار نماذج من عائلات Llama وOlmo وQwen، التي تتراوح أحجامها بين 8 مليار و32 مليار معلمة.

أظهرت هذه النماذج قدرة مذهلة على اكتشاف وتحديد موقع الاضطرابات بدقة تصل أحيانًا إلى 100%. كما يمكن لهذه النماذج تعلم التمييز بين الضبابية والضوضاء الغاوسية عندما تُعطى دلائل في السياق.

ومن الأمور المثيرة للاهتمام هي أن دقة نموذج Qwen3-32B في تحديد نوع الاضطراب تتحسن مع زيادة قوة الاضطراب، وتتناقص عند تغيير تسميات السياق، مما يدل على وجود أولوية لفهم التصنيفات الصحيحة.

تُعتبر تقنية الضبابية جزءاً أساسياً من تقنيات تدريب النماذج لتقليل الإفراط في التخصيص، بينما تُستخدم الضوضاء الغاوسية أحيانًا أثناء مرحلة الاستدلال. ولهذا السبب، يناقش الباحثون إمكانية وجود إشارة تدل على "الوعي بالتدريب" تكون مستقلة عن البيانات، وما يمكن أن يعنيه ذلك بالنسبة لسلامة الذكاء الاصطناعي.

إن هذه النتائج تفتح آفاقاً جديدة لفهم كيفية تعامل نماذج الذكاء الاصطناعي مع التغييرات البيئية وكيف يمكن تحسين دقة هذه الأنظمة. ما رأيكم في هذا التطور؟ شاركونا في التعليقات.