في الساحة الطبية الحديثة، تشهد تقنيات الذكاء الاصطناعي تحولًا جذريًا بفضل الابتكارات الجديدة التي تهدف إلى تحسين عملية التشخيص. من بين هذه الابتكارات، يبرز مشروع MedAction، الذي يسعى إلى تحويل كيفية تقييم التشخيصات السريرية من خلال نماذج اللغة الضخمة (LLMs).

تتميز معظم نماذج LLM الحالية بتقييمات تعتمد على إعدادات ثابتة ودوران واحد، حيث يتم تقديم معلومات كاملة عن المريض بشكل مباشر، وهو ما يمثل تبسيطًا مفرطًا للواقع السريري. في الواقع، تتطلب عملية التشخيص النشط التواصل المستمر بين الأطباء والمعلومات الجديدة، بدءًا من الملاحظات الأولية، مرورًا بطلب الفحوصات، وصولاً إلى تفسير النتائج وتحديث التشخيصات بناءً على الأدلة المتطورة.

من خلال تحليل شامل، حدد الباحثون ثلاث عوائق متكررة في نماذج LLM الحالية: طلب الفحوصات غير المتماسكة، تحديث التشخيص غير الموثوق، وانخفاض التناسق في الأدوار المتعددة. تكشف هذه الفشلات عن نقص أساسي في بيانات التدريب الطبية الحالية، حيث تعلّم النماذج كيفية التفكير من خلال المعلومات الكاملة ولكنها لا تدربها على العمل تحت ظروف الأدلة المتغيرة.

لمعالجة هذه الفجوة، يأتي MedAction كحل مبتكر يتضمن خط أنابيب مهيكل لتكرير البيانات، يعمل على دمج المسارات التشخيصية المتنوعة وعالية الجودة عبر تفاعل النماذج مع البيئة. كما يقدم المشروعMetricين جديدتين grounded باستخدام الرسوم البيانية للمعرفة، وهما: تناسق مسار المرض (Disease Trajectory Consistency - DTC) والذي يتعقب ما إذا كانت فرضية النموذج تتجه نحو التشخيص الصحيح، وتناسق التفكير والإجراء (Reasoning-Action Consistency - RAC) الذي يتحقق من أن تحديثات الاعتقاد مدفوعة بالأدلة المتجمعة.

من خلال هذا الخط، تم إنشاء مجموعة بيانات MedAction-32K، التي تتكون من 32,681 مسارًا مستمدة من 2,896 حالة طبية. ومن خلال ضبط نموذج بقوة 8 مليار على مجموعة البيانات هذه، تمكن الباحثون من تحقيق أداء غير مسبوق بين النماذج مفتوحة المصدر، محققين تقدمًا كبيرًا في دقة وكفاءة نماذج الذكاء الاصطناعي في الرعاية الصحية.

إن تأثير MedAction قد يكون بعيد المدى، ليس فقط من خلال تحسين دقة التشخيصات، ولكن أيضًا عبر تعزيز القدرة على التعامل مع المعلومات الطبية بطريقة أكثر ديناميكية وتطورًا. ما رأيكم في هذا التطور؟ شاركونا في التعليقات.