تعد نماذج الأساس (Foundation Models) من الابتكارات الأكثر إثارة في مجالات الذكاء الاصطناعي، حيث تعد بتوفير إطار موحد لمجموعة متكاملة من المهام السريرية. ومع ذلك، أظهرت الأبحاث الأخيرة في مجال السونار (Ultrasound) أن هذه النماذج الموحدة قد تكون أقل كفاءة مقارنةً بالنماذج المخصصة لكل مهمة. يطرح هذا الواقع تساؤلات حول كيفية تحسين أداء نماذج السونار باستخدام استراتيجيات تجميع المهام.
في بحث حديث، افترض الباحثون أن انخفاض الأداء لا يعود إلى حدود سعة النموذج، بل إلى استراتيجيات تجميع المهام التي تتجاهل التفاعلات بين تنوع المهام وحجم بيانات التدريب المتاحة. لتوضيح ذلك، تم تطوير نموذج M2DINO، وهو إطار متعدد المهام ينطلق من DINOv3 ويستخدم وحدات Mixture-of-Experts المعتمدة على المهام لتخصيص الطاقة بشكلٍ مرن.
قام الفريق بتحليل 27 مهمة في السونار، تشمل التقسيم (Segmentation)، التصنيف (Classification)، الكشف (Detection)، والانحدار (Regression). واستندت الدراسات إلى ثلاثة أنماط من التدريب: النمط المحدد لكل مهمة، التجميع السريري، والتدريب الموحد لجميع المهام. ووجد الباحثون أن فعالية التجميع تعتمد بشكلٍ كبير على حجم بيانات التدريب، حيث يمكن أن يحسن التجميع السريري الأداء في حالات توفر بيانات غزيرة، لكن يمكن أن يؤدي إلى انخفاض كبير في الأداء عندما تكون البيانات محدودة.
علاوةً على ذلك، لوحظ أن حساسية المهام تختلف حسب نوع المهمة، حيث يظهر التقسيم أكبر انخفاض في الأداء مقارنةً بالانحدار والتصنيف.
تقدم هذه النتائج توجهات عملية لنماذج السونار، مما يبرز أهمية التركيز على توافر بيانات التدريب وخصائص المهامعند تطبيق استراتيجيات التجميع بدلاً من الاعتماد وحده على التصنيفات السريرية.
نموذج التصوير الطبي: كيف تعزز استراتيجيات تجميع المهام من أداء نماذج السونار؟
تتطلع نماذج السونار الموحدة إلى تحسين قدرات التصوير الطبي، لكن هل تعمل فعلاً كما هو متوقع؟ اكتشف كيف تؤثر استراتيجيات تجميع المهام على الأداء في هذا المجال المتطور.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
