تعد أنظمة الإجابة البصرية (Visual Question Answering - VQA) عنصرًا محوريًا في التطبيقات الجراحية، حيث تؤدي الإجابات غير الدقيقة أو الغامضة إلى مخاطر قد تؤثر على صحة المرضى. وعلى الرغم من أن تقديرات الشكوك الحالية، مثل Semantic Nearest Neighbor Entropy (SNNE)، تقدم رؤى مهمة، إلا أنها غالبًا ما تفشل في أخذ السؤال المحدد بعين الاعتبار، مما قد يؤدي إلى نتائج غير موثوقة.
لذا تم تقديم نموذج جديد يحمل اسم Question-Aligned Semantic Nearest Neighbor Entropy (QA-SNNE) الذي يعمل على تضمين توافق الأسئلة والإجابات في تقدير الشكوك، من خلال تطبيق تقنية البوابات الثنائية. يعتمد QA-SNNE على قياس الشكوك من خلال وزن التشابهات الدلالية بين الإجابات المستمدة، مع مراعاة أهميتها بالنسبة للسؤال المطروح، مما يعزز دقة النتائج بشكل كبير.
كجزء من التجارب، تم إعادة صياغة قاعدة بيانات معيارية لأنظمة الإجابة البصرية الجراحية، حيث تم تعديل صياغة الأسئلة فقط بينما تظل الصور والإجابات الحقيقية دون تغيير. أشارت النتائج إلى تحسن ملحوظ في أداء خمسة نماذج VQA، مع زيادة تصل إلى 15% في نموذج Llama3.2، و21% في Qwen2.5، وعلاوة على ذلك، حقق QA-SNNE تحسينًا بلغ 8% في حالة الأسئلة المعاد صياغتها.
بشكل عام، يمثل QA-SNNE وسيلة عملية وآمنة لتحسين أنظمة VQA الجراحية من خلال دمج عدم اليقين الدلالي مع صلة السؤال، مما يفتح آفاقًا جديدة لتعزيز أمان التطبيقات الطبية.
تعزيز أمان أنظمة الإجابة البصرية: اكتشاف مفهوم تقني جديد لتقدير الشكوك في الجراحة
تقدم دراسة جديدة منهجية مبتكرة لتعزيز موثوقية أنظمة الإجابة البصرية في السياقات الجراحية، مما يخفف من المخاطر المرتبطة بالإجابات الغامضة أو الخاطئة. مع استخدام تقدير الشكوك المرتبطة بالأسئلة، يصبح التواصل أكثر فعالية وأمانًا.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
