في عالم التنظير الداخلي (Gastrointestinal Endoscopy)، تكمن التحديات الرئيسية أمام أنظمة الذكاء الاصطناعي في نقص البيانات المعنونة (Annotated Data) وزيادة قيود الخصوصية. هذه العوامل تعيق تطبيق النماذج الذكية في الممارسات السريرية، مما يؤثر على موثوقية التشخيص وقابليته للتوسع.
تظهر الأبحاث الحديثة نموذجاً مبتكراً يُعرف بـ "نموذج خط الأنابيب الثنائي PEFT" (Parameter-Efficient Fine-Tuning)، والذي يتناول مشكلتين رئيسيتين: "الإجابة على الأسئلة المرئية الطبية" (Medical Visual Question Answering - VQA) وتوليد بيانات اصطناعية تحافظ على الخصوصية.
اعتمدت هذه الدراسة على نموذج "فلورنسا-2" (Florence-2) للرؤية واللغة، والذي يسهم في تحسين فهم النموذج مع تقليل التكلفة الحسابية أثناء التدريب. كما تم استخدام تقنية "التكيف ذو الرتبة المنخفضة" (Low-Rank Adaptation - LoRA) مع تقنية "التوليد المستقر" (Stable Diffusion 2.1) لتوليد صور عالية الجودة للجهاز الهضمي، مما يعزز قواعد بيانات التدريب دون انتهاك خصوصية المرضى.
استخدمت هذه الأبحاث مجموعة بيانات "كفاسير-VQA" (Kvasir-VQA)، وحقق نموذج VQA الخاص بفلورنسا-2 نتائج رائعة، حيث حصل على نتيجة ROUGE-1 قدرها 0.92 وROUGE-L بنسبة 0.91، كما تحسنت درجة BLEU من 0.08 إلى 0.24. وكان التحسين عند تدريب النموذج على مجموعات بيانات خاصة أفضل باستمرار مقارنة بالمجموعات العامة.
استطاع نموذج LoRA ذو الرتبة الرابعة تحقيق أعلى أداء ملموس، مع نتيجة وفاء (Fidelity Score) قدرها 0.290 ونسبة اتفاق (Agreement Score) تصل إلى 0.730، حيث خفض التكاليف الحسابية بما يقارب 90%. هذا الإطار يعزز الإمكانات السريرية للذكاء الاصطناعي في التنظير الداخلي.
وعند المقارنة مع نماذج FLUX وMSDM وKandinsky 2.2، أثبت نموذجنا تفوقه في درجة FBD (Frechet BiomedCLIP Distance) وتوافقه النصي. في حين أن بعض النماذج تتفوق في الوفاء أو الاتفاق، فإن FBD الأقل لدينا يدل على تماسك أفضل بين الصورة والنص.
تثبت هذه النتائج أن نهجنا يمثل حلاً قوياً لتعزيز الإجابة على الأسئلة المرئية وإنتاج البيانات الاصطناعية في الذكاء الاصطناعي السريري.
ثورة في التنظير الداخلي: نموذج PEFT الذكي الذي يحل مشاكل البيانات الطبية!
تمثل أنظمة الذكاء الاصطناعي في التنظير الداخلي تحديات كبيرة بسبب نقص البيانات المعلنة وسياسات الخصوصية الصارمة. أبحاث جديدة تقدم نموذج PEFT لحل مشكلات الإجابة على الأسئلة المرئية وتوليد بيانات طبية آمنة.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
