في عالم الأبحاث البيولوجية، يستمر الذكاء الاصطناعي في إعادة تعريف الحدود التي نعرفها. في دراسة جديدة، تم استخدام تقنية المشفرات التلقائية الهزيلة (Sparse Autoencoders - SAEs) كوسيلة لفهم نماذج لغة الأجسام المضادة، مما يسلط الضوء على إمكانياتها في تقديم رؤى حول المفاهيم المتعلمة داخل نماذج البروتينات الكبيرة.

تم تطبيق أسلوب SAEs، وبالتحديد تقنيات TopK وOrdered، بهدف استكشاف نماذج اللغة الأوتورجريسيف (autoregressive)، وهذا يمثل رحلة جديدة نحو فهم كيفية توليد الأجسام المضادة. تظهر النتائج أن SAEs من نوع TopK يمكن أن تكشف عن ميزات كمنزلة ذات دلالات حيوية، إلا أن وجود علاقة وثيقة بين السمات والمفاهيم لا يضمن السيطرة السببية على عملية التوليد.

على الجانب الآخر، تفرض تقنية Ordered SAEs هيكلًا هرميًا يحدد ميزات يمكن توجيهها بموثوقية، لكن ذلك يأتي بتكلفة زيادة تعقيد أنماط التنشيط، مما يجعلها أقل وضوحًا في بعض الأحيان.

تشير هذه النتائج إلى أن فهم آليات النماذج اللغوية الخاصة بالمجالات البيولوجية يتقدم بشكل كبير، مما يوفر أدوات جديدة للمساعدة في تحسين طريقة تحكمنا في التوليد البيولوجي، حيث تكون TopK SAEs كافية لرسم خرائط بين الميزات الكامنة والمفاهيم، بينما تعتبر Ordered SAEs مفضلة عند الحاجة إلى توجيه دقيق في عمليات التوليد.