تواجه عملية تصنيف الصور الطبية تحديًا أساسيًا يتمثل في وجود نقص شديد في البيانات. فبينما تحقق نماذج التعلم العميق (Deep Learning) أداءً مذهلاً، إلا أن الظروف السريرية الحقيقية تعاني من عزوف كبير عن البيانات بسبب تكاليف التعليق وقيود الخصوصية وندرة الأمراض. تبرز هذه المشكلة بشكل خاص في تصنيف الندبات، حيث يتطلب التمييز بين الكيلويد والندبات الهيكلية معرفة دقيقة ومتخصصة، والبيانات المتاحة لهذا التمييز تكاد تكون معدومة.

في هذا المقال، نقدم إطار عمل جديد يُعرف باسم ScaFE (Scar Feature Engineering) يهدف إلى إعادة توجيه نماذج اللغات الكبيرة (LLMs) للعمل كمهندسين للميزات المعرفة بدلاً من مصنفين نهائيين. تعتمد فكرتنا الأساسية على أن نماذج اللغات الكبيرة تتضمن معرفة طبية ثرية يمكن تحويلها إلى كود استخراج ميزات يمكن تنفيذه، مما يتيح لنا تحويل الصور عالية الأبعاد إلى تمثيلات منخفضة الأبعاد يمكن تفسيرها سريريًا.

على وجه الخصوص، نقوم بتحفيز نموذج اللغة الكبيرة بمعايير تقييم الندبات المعروفة لإنتاج كود بايثون (Python) محدد يستخرج الميزات المتوافقة مع أنظمة تصنيف سريرية مثل مقياس الندبة في فانكوفر (Vancouver Scar Scale). يقدم نهجنا ثلاثة مزايا رئيسية:

1. **كفاءة البيانات**: حيث يمكن للنموذج تحقيق أداء قوي مع عينات تدريب محدودة من خلال فصل اكتساب المعرفة عن التعلم الإحصائي.
2. **حفظ الخصوصية**: حيث تتم معالجة الصور الخام محليًا دون التعرض لنماذج لغات خارجية.
3. **قابلية التفسير**: من خلال الميزات الواضحة المرتبطة بالتفكير السريري.

تظهر التجارب الواسعة على تصنيف الندبات أن طريقتنا تتفوق باستمرار على أساليب التعلم العميق التقليدية أو استخدام نماذج اللغات الكبيرة كمصنفات صندوق أسود في ظل ظروف بيانات محدودة. مما يبرز اتجاهًا واعدًا لإدماج نماذج اللغات الكبيرة في أنظمة الذكاء الاصطناعي الطبية التي تتسم بكفاءة البيانات وشفافية سريرية.