في عالم الذكاء الاصطناعي، لطالما كانت دراسة كيفية استرجاع المعلومات من نماذج اللغة (Language Models) مسألة تدعو للتفكير. فكيف يمكن لهذه النماذج، التي تتكون من شبكة من الخلايا العصبية، أن تتذكر معلومات معينة تتعلق بالكائنات مثل الأشخاص أو الأماكن؟

في دراسة حديثة نُشرت على موقع arXiv، أجرى الباحثون بحثاً مثيراً حول ما يُعرف باسم "خلايا الكيانات" (Entity Cells)، والتي تُشبه في مفهومها فرضية "خلايا الجدة" (Grandmother Cell) المعروفة في علم الأعصاب. لقد قاموا بالبحث عن خلايا عصبية متخصصة تكون نشطة في سياقات محددة، وتحديداً عند الحديث عن كيانات معينة.

قام الباحثون بتطبيق طريقة تصنيف خلايا عصبية بناءً على تناسق النشاط عند استخدام محفزات متنوعة تتعلق بنفس الكيان عبر سبعة نماذج مختلفة تم اختيارها من مجموعة مصنفة من PopQA. ولقد وجدت النتائج أن هذه الخلايا المحددة تتجمع في الطبقات الأولى من الشبكات، وهي ملاحظة تجريبية تتجاوز بنية النموذج.

أظهرت تجربة استخدام نموذج Qwen2.5-7B أن هناك أدلة سببية واضحة: حيث إن كبت أحد الخلايا العصبية المحددة يؤدي إلى فقدان الذاكرة الخاصة بالكيان المعني، بينما تبقى المعلومات الخاصة بالكيانات الأخرى سليمة. وفي المقابل، تفعيل خلية واحدة كافٍ لاستعادة المعرفة الصحيحة لمعظم الكيانات، حتى في حالة غياب الكيان عن السياق.

كما اكتشف الباحثون أن نفس الخلايا تعمل مع الأسماء المستعارة، الاختصارات، الأخطاء الإملائية، والأشكال اللغوية المتعددة، مما يشير إلى أنها تشفر هوية الكيان بصورة أساسية بدلاً من الأنماط السطحية للكلمات.

تظهر الإشارات السببية تبايناً بين عائلات النماذج المختلفة، مما يدل على الفروقات المعمارية في كيفية تنظيم المعرفة المتعلقة بالكيانات. تعد هذه النتائج بمثابة نقاط وصول ملموسة وقابلة للتفسير لفهم وتنظيم وتصحيح المعرفة الفعلية في نماذج اللغة، وتفتح بابًا لاستكشاف الأسئلة القديمة في علم الأعصاب حول تشفير المفاهيم بصورة مجزأة.