في عالم الذكاء الاصطناعي، يحقق نموذج ViToS الذي يعتمد على التعلم المعزز (Reinforcement Learning) إنجازات مدهشة في معالجة الصور الطبية. يتجاوب هذا النموذج مع التحديات المرتبطة بالصور الطبية التي تتسم بنقص الأدلة المرئية.
بينما تعد نماذج رؤية اللغة (Vision-Language Models) خطوة هامة في التقدم التكنولوجي، إلا أن الصور الطبية غالبًا ما تكون صعبة المعالجة بسبب عدم توافر معلومات بصرية كافية. لكن فريق الباحثين أقر بأن تقليم التوكنز البصرية خارج نطاق التثبيت يمكن أن يُعين كثيراً على تحسين التفكير الطبي.
وبالتالي، يُقدم نموذج ViToS إطار عمل مزدوج يتضمن فرعين مختلفين؛ أحدهما يركز على تثبيت المعلومات والثاني يقوم بمعالجة معلومات عالية الكفاءة بعد تقليم التوكنز. إضافةً إلى ذلك، يتغلب نموذجنا على مشاكل التعلم المرتبطة بالتوجيه المتبادل بفضل تقنية تحسين متسلسل تعتمد على التغذية المرتدة المتقاطعة (cross-feedback sequential optimization).
باستخدام في مجال التقييم الطبي، أثبت نموذج ViToS فعاليته حيث قام بتقليص طول التوكنز البصرية إلى 77% من الطول الأصلي، محققًا أداءً مميزًا بمعدل 108.27% على نموذج Lingshu-7B و104.16% على HuatuoGPT-Vision-7B.
إن إنجازات ViToS تمهد الطريق لنموذج طبي متطور يعزز من سرعة ودقة التطبيقات في مجال الذكاء الاصطناعي.
ثورة في الذكاء الاصطناعي: نموذج ViToS يقدم تقنيات جديدة لفهم الصور الطبية!
اكتشاف جديد في عالم الذكاء الاصطناعي يقدم نموذج ViToS الذي يُحدث تحولًا كبيرًا في معالجة الصور الطبية. يهدف النموذج إلى تحسين قرارات التشخيص سريريًا من خلال تقنيات تقليل التوكنز البصرية.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
