أصبح الذكاء الاصطناعي (AI) جزءًا لا يتجزأ من التحول الرقمي في مجالات الصحة والعلاج، حيث تسعى المؤسسات الطبية إلى استخدامها لتحسين التجربة العلاجية. في هذا السياق، تم الكشف عن دراسة جديدة تركز على تطوير نظام فعال في مجال الإجابة على الأسئلة الطبية من خلال الدمج بين الرؤية واللغة، وهو ما يُعرف بـ Medical Visual Question Answering (VQA).
تتميز نماذج الرؤية-اللغة الصغيرة (Small Vision-Language Models) التي تتراوح سعتها بين 2-8 مليار معلمة، بأنها مثالية للتطبيقات السريرية، نظرًا لقيود الخصوصية، ضعف الاتصال، ومتطلبات السرعة المنخفضة التي تدعم الاستدلال على الأجهزة أو في المواقع. ورغم ذلك، فإن قدرتها المحدودة قد تساهم في إنتاج مخرجات صحيحة ولكن غير دقيقة.
لذا، قامت الدراسة بتوسيع طريقة الترميز القائم على نظرية الألعاب، التي كانت تقتصر سابقًا على مهام معالجة اللغة الطبيعية المغلقة، لتشمل نماذج الرؤية-اللغة في حالات الاستجابة المفتوحة للأسئلة الطبية. وقد تم تقديم معيار توقف واصرار واتيرشتاين، الذي يستبدل مطابقة ترتيب الكلمات، مما يمكّن من تحسين دقة الإجابات بشكل ملحوظ.
أظهرت النتائج على مجموعات البيانات VQA-RAD وPathVQA تحسنًا كبيرًا وثابتًا في الأداء، حيث تم تحسين نموذج Qwen3-VL-2B بنحو 3.5 نقطة مئوية (p < 0.01) متجاوزًا النموذج الجشع ذو 4 مليار معلمة. وفي دراسة PathVQA، تساوى نموذج Gemma-3-4B مع MedGemma-4B في الأداء رغم عدم وجود تحسين معين للنطاق.
مع التوازن الكمي، استطاعت معايير واتيرشتاين تقليل متوسط عدد دورات التوافق بمعدل يقارب 20%، مما يعزز كفاءة الاستدلال مع الحفاظ على سلوك التوازن القائم على نظرية الألعاب.
لمزيد من التفاصيل، يمكنكم الوصول إلى كود البرمجة المتاح على GitHub: https://github.com/luca-hagen/Wasserstein-BDG-medical-VQA.
في ظل هذه التطورات الرائعة، ما رأيكم في تأثير مثل هذه التقنيات على مستقبل الرعاية الصحية؟ شاركونا آرائكم في التعليقات!
ابتكار جديد في الذكاء الاصطناعي: توظيف تقنيات واتيرشتاين لتحسين إجابات الأسئلة الطبية المرئية
تقدم دراسة جديدة تقنية مبتكرة تعتمد على مبدأ واتيرشتاين لتحسين أداء نماذج الذكاء الاصطناعي في مجال الإجابة عن الأسئلة الطبية المرئية. هذه التقنية تساهم في تقليل الأخطاء وتحسين دقة النتائج بشكل ملحوظ.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
