تعتبر النماذج الذكية (Machine Learning Models) في مجال العلوم الطبية اعتمادا كبيرا على دقة التصنيفات، ومع ذلك، تظل عملية وضع العلامات على بيانات السلاسل الزمنية الطبية (Biomedical Time-Series Data) تمثل تحديًّا كبيرًا. في محاولة للتغلب على هذا التحدي، أجريت دراسة حديثة لتقييم ثلاث طرق لاختيار العينات بهدف تحسين عملية وضع العلامات:

1. **العينة العشوائية (RND)**،
2. **التحرك لأبعد نقطة أولاً (FAFT)**،
3. **طريقة قائمة على واجهة المستخدم الرسومية**، والتي تتيح استكشاف تصورات ثنائية الأبعاد (2D Visualizations) للبيانات ذات الأبعاد العالية.

أُجريت هذه الدراسة عبر أربع مهام تصنيف مختلفة تتعلق بتقييم حركة الأطفال (Infant Motility Assessment) والتعرف على مشاعر الكلام (Speech Emotion Recognition). شارك اثنا عشر معلقًا، تم تصنيفهم كخبراء أو غير خبراء، في عملية وضع العلامات تحت ميزانية محدودة.

بعد التجارب، أظهرت النتائج أن طريقة التصوير التفاعلي ثنائي الأبعاد (2DV) كانت الأكثر كفاءة عند جمع العلامات عبر المعلقين. وفي مهام تقييم حركة الأطفال، تمكنت 2DV من التقاط الفئات النادرة بفعالية، لكنها أظهرت أيضًا تباينًا أكبر في توزيع العلامات بين المعلقين، مما أثر سلبًا على الأداء عند تدريب النماذج على علامات المعلقين الفرديين، حيث تفوّقت طريقة FAFT في هذه الحالات.

أما بالنسبة لمهمة التعرف على مشاعر الكلام، فقد تفوّقت 2DV على الطرق الأخرى بين المعلقين الخبراء، وكانت مساوية لأدائهم بين غير الخبراء.

تحليل مخاطر الفشل أظهر أن العينة العشوائية كانت الخيار الأكثر أمانًا عندما كان عدد المعلقين أو خبرتهم غير مؤكدة، في حين كانت 2DV تحمل أعلى نسبة مخاطر بسبب تباين توزيع العلامات.

علاوة على ذلك، أظهرت مقابلات ما بعد التجربة أن استعمال 2DV جعل مهمة وضع العلامات أكثر إثارة ومتعة.

بشكل عام، تبرز أساليب الاختيار المعتمدة على التصوير التفاعلي ثنائي الأبعاد كخيار واعد لوضع علامات على بيانات السلاسل الزمنية الطبية، خصوصًا عند عدم وجود قيود صارمة على ميزانية وضع العلامات. هل تعتقد أن هذه الطرق ستغير مستقبل علوم البيانات الطبية؟ شاركونا آراءكم في التعليقات!