تعتبر مشكلة بيانات التصنيف الخاطئ، أو ما يعرف بـ "ضوضاء التسميات"، من التحديات الكبيرة التي تواجه نماذج التعلم الآلي الموجه. تلك الضوضاء تؤدي إلى ضعف الأداء من خلال تعليم النموذج ارتباطات خاطئة بين الخواص والتسميات، مما ينعكس سلبًا على دقة النماذج في البيانات المخصصة للاختبار والتحقق.

حتى الآن، اعتمدت تطبيقات علم الزلازل بشكل رئيسي على مجموعات بيانات ضخمة أو تقنيات زيادة البيانات للتخفيف من تأثير هذه الضوضاء، وهو ما يتطلب جهدًا ووقتًا كبيرين.

في إطار هذا التعب، يُقدّم الباحثون تقنية جديدة تُدعى التعلم القوي ذو التباين القائم على الضوضاء في التسميات (Label Noise-Contrastive Robust Learning - LaNCoR). هذه التقنية تهدف إلى التعامل مع التسميات الخاطئة في مهام معالجة إشارات الزلازل بدون الحاجة إلى مجموعات تدريب ضخمة. من خلال محاذاة توزيعات الميزات والتسميات في فضاء الميزات، تتمكن LaNCoR من تصحيح الأخطاء في التصنيف وتقليل تأثيرها السلبي على عملية التدريب.

تم تقييم أداء LaNCoR في مهمة تمييز وقت وصول الطور P في بيانات سيزمية حقيقية باستخدام نموذجين أساسيين وطريقتين مختلفتين للتدريب. أظهرت النتائج أن LaNCoR تستطيع تحسين الأداء بنسبة تصل إلى 28.8% عبر معايير الأداء المختلفة. هذه التقنية تحمل واعدًا كبيرًا في تدريب النماذج في مجالات الزلازل والعلوم الجيولوجية.

ما رأيكم في هذه التقنية الجديدة؟ هل تعتقدون أنها ستغير منظور التعامل مع بيانات الزلازل؟ شاركونا آراءكم في التعليقات.