في خطوة جريئة نحو تحسين الدراسات البيئية، تم اقتراح نظام جديد لتوصيف السمات المورفولوجية (Morphological Traits) للكائنات الحية باستخدام تقنيات الذكاء الاصطناعي. تعتبر السمات المورفولوجية خصائص حيوية للكائنات توفر دلائل هامة حول كيفية تفاعل هذه الكائنات مع بيئتها. ومع ذلك، كانت عملية استخراج هذه السمات تتم ببطء وتعتمد على الخبراء، مما يحد من استخدامها في الدراسات البيئية واسعة النطاق.

تكمن المشكلة الرئيسية في عدم وجود مجموعات بيانات عالية الجودة تربط الصور البيولوجية بتوصيفات السمات. لكن في هذا العمل الجديد، تم استخدام مشفرات تلقائية (Autoencoders) مدربة على ميزات نماذج الأساس (Foundation Models) لإنتاج خلايا عصبية ذات معنى واحد وموضوعة مكانيًا، مما يؤدي إلى تنشيطها باستمرار على أجزاء مورفولوجية ذات معنى.

بفضل هذه الخاصية، تم تقديم نظام لتوصيف السمات يقوم بتحديد المناطق البارزة ويستخدم تحفيز الرؤية واللغة (Vision-Language Prompting) لتوليد وصفات سمات مفهومة. من خلال هذه المقاربة، تم إنشاء مجموعة بيانات Bioscan-Traits التي تضم 80,000 توصيف سمات تغطي 19,000 صورة حشرية من BIOSCAN-5M. وقد أكدت التقييمات البشرية على صلاحية الوصف المورفولوجي المولد بيولوجيًا.

لتقييم حساسية التصميم، تم إجراء دراسة شاملة تهدف إلى تغيير الاختيارات التصميمية الرئيسية وقياس تأثيرها على جودة الوصف الناتج. من خلال تطبيق نظام توصيف السمات بشكل تقني منفصل بدلاً من الاعتماد على الجهود اليدوية المكلفة، نقدم طريقة قابلة للتوسع لإدخال إشراف بيولوجي ذي معنى في نماذج الأساس، وتمكين تحليلات مورفولوجية واسعة النطاق، وسد الفجوة بين الأهمية البيئية والعملية في تعلم الآلة.