تُعد عملية تقسيم الصور في المجال الطبي (Semantic Segmentation) من المهام الحرجة، لكنها تشكل تحدياً كبيراً نظراً لنقص البيانات والتباين العالي بين أنماط التصوير. على الرغم من أن النماذج الأساسية مثل نموذج Segment Anything Model (SAM) تظهر وعوداً واعداً، إلا أنها غالباً ما تواجه صعوبات مع الصور الطبية التي تحتاج إلى تكييف خاص.

أحد أكبر التحديات يكمن في التفاعل مع المستخدم، حيث تُعتبر النقاط الاستدلالية (Point Prompts) هي الوسيلة الأكثر طبيعية، لكنها لا تُقدم السياق المكاني الكافي لضمان تقسيم موثوق، خصوصاً عندما تكون الهياكل المستهدفة غير منتظمة أو ذات تباين ضعيف.

في ورقة بحثية جديدة، يُقترح إطار تقسيم محسّن يدمج وحدة Box Predictor الخفيفة في هيكل MedSAM. تقوم هذه الوحدة بتقدير صندوق محيط تقريبي من خلال نقرة مستخدم واحدة، باستخدام ميزات تضمين الصورة المحلية. وبذلك، تقدم إرشاداً مكانياً يُقلل من الغموض الناتج عن النقاط الاستدلالية، مع إضافة 1.6 مليون معلمة إضافية فقط وعبء استدلال ضئيل.

تم تنفيذ عملية تدريب من مرحلتين، حيث يتم تدريب Box Predictor بشكل مستقل قبل دمجه مع MedSAM. لتقييم القدرة التعميمية لطريقتنا، أجرينا تقييمات شاملة على أربعة مجموعات بيانات متنوعة تشمل FLARE22، BRISC، BUSI، وLungSegDB، والتي تمثل أنماط تصوير مختلفة مثل الأشعة المقطعية (CT)، والرنين المغناطيسي (MRI)، والألتراساوند.

أظهرت الطريقة المحسّنة دقة وموثوقية في تقسيم الصور عبر هياكل تشريحية متنوعة ومجالات تصوير متعددة، محققة نقاط Dice قدرها 0.89 (في BUSI)، 0.93 (في FLARE22)، 0.88 (في BRISC)، و0.98 (في LungSegDB).

هذا البحث يُسلط الضوء على أهمية الابتكار في تطوير تقنيات الذكاء الاصطناعي لتعزيز دقة واستدامة التقنيات في المجالات الطبية. ما رأيكم في هذا التطور؟ شاركونا في التعليقات.