في عالم البيولوجيا الصوتية، الذي يهتم بدراسة الأصوات التي تنتجها الكائنات الحية، تلعب هذه الأصوات دوراً حيوياً في مجالات الحفاظ على البيئة ورصد التنوع البيولوجي ودراسات السلوك. ومن خلال استخدام تقنيات التعلم الآلي، يمكن التصنيف والكشف عن الأنواع والسلوكيات المختلفة بكفاءة عالية.

تعتبر قلة البيانات المعنونة من أبرز التحديات التي تواجه هذه الأبحاث، مما يستدعي الحاجة إلى تشفير صوتي حيوي متعدد الأغراض يمكنه استخراج تمثيلات مفيدة لمهام مختلفة. رغم أن بعض النماذج قد تم اقتراحها مسبقاً، إلا أنها غالباً ما كانت محدودة، حيث كانت تركز على أنواع ضيقة (عادة الطيور) واعتمادها على نموذج معماري أو نظام تدريبي واحد.

في الدراسة الجديدة، تم إجراء دراسة تجريبية واسعة النطاق تغطي جوانب البيولوجيا الصوتية التي كانت نادرة التركيز عليها في الأبحاث السابقة، مثل تنوع البيانات التدريبية وحجمها، وهياكل النماذج ووصفات التدريب، بالإضافة إلى نطاق المهام ومجموعات البيانات المستخدمة في التقييم.

توصل الباحثون إلى نماذج تشفير تعد الأحدث في مجالها، كما حددوا العوامل المهمة لتدريب هذه النماذج، الأمر الذي يمكن العمل عليه عند توفر المزيد من البيانات أو اقتراح هياكل أفضل. عبر 26 مجموعة بيانات تتضمن مهام مثل تصنيف الأنواع وكشف الهوية الفردية واكتشاف الأصوات، أظهرت النتائج أن التدريب الذاتي الذاتي يليه التدريب تحت إشراف على مجموعة بيانات تجمع بين البيولوجيا الصوتية والصوتيات العامة يؤديان إلى أفضل أداء داخل وخارج التوزيع.

أظهرت هذه الدراسة أيضاً أهمية تنوع البيانات في كلا المرحلتين. لدعم الأبحاث والتطبيقات المستمرة، سيتم إصدار نقاط التحقق للنموذج، مما يتيح للباحثين ربط جهودهم المستقبلية بتقنيات الذكاء الاصطناعي المتطورة.