في عالم الطب الحديث، يعتبر تمييز الصور الطبية ركيزة أساسية في اتخاذ القرارات السريرية، وعلى الرغم من ذلك، فإن النماذج الحالية غالباً ما تكون مجزأة ولا تعكس تعقيدات الممارسات السريرية. معظم النماذج تُدرّب على مصادر معرفة محددة تفصل بين المهام، أو الأنماط، أو الأعضاء، مما يُحدث تبايناً واضحاً مع كيفية عمل الأطباء الذين يحتاجون إلى دمج تنوع من المعرفة.
هنا يأتي نموذج K-Prism الذي يقدم إطار عمل موحد يتميز بالمرونة التي تعكس الغالب في السياقات السريرية. يقوم K-Prism بدمج ثلاثة أطر معرفية أساسية: (1) الـsemantic priors المستندة إلى مجموعات بيانات مصنفة، (2) المعرفة في السياق (in-context knowledge) المستمدة من أمثلة قليلة، و(3) التغذية الراجعة التفاعلية من المستخدمين مثل النقرات أو الرسوم التوضيحية.
الفكرة الرئيسية هنا تكمن في أنه يمكن تمثيل هذه المصادر المعرفية المتنوعة ضمن نموذج ثنائي العوامل من خلال: 1-D sparse prompts التي تحدد 'ما يجب تمييزه' و2-D dense prompts التي تشير إلى 'أين يجب الانتباه'. هذه التعليمات تُعالج بشكل ديناميكي عبر المعالج المختلط للخبراء (Mixture-of-Experts - MoE) مما يسمح بالتبديل المرن بين الأطر المختلفة وتدريب مشترك عبر مهام متنوعة دون الحاجة إلى تعديلات معمارية.
تظهر التجارب الشاملة التي أجريت على 18 مجموعة بيانات عامة تغطي أنماطًا متعددة مثل التصوير المقطعي المحوسب CT، والتصوير بالرنين المغناطيسي MRI، والأشعة السينية، وعلم الأمراض، والموجات فوق الصوتية، أن K-Prism يحقق أداءً رائدًا عبر إعدادات التمييز الدلالي (semantic)، والمعرفة في السياق (in-context)، والتفاعل.
K-Prism: نموذج متكامل لتميز الصور الطبية من خلال المعرفة والتفاعل
تقدمت الأبحاث في مجال تمييز الصور الطبية مع ظهور نموذج K-Prism الذي يجمع بين المعرفة والمرونة التفاعلية. يعد هذا الابتكار خطوة هامة نحو تحسين اتخاذ القرارات السريرية ودعم الأطباء في عملهم اليومي.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
