تشهد الدول ذات الدخل المنخفض والمتوسط نقصًا كبيرًا في الأطباء المدربين على الفحص بالأشعة الصوتية، حيث يعاني أكثر من نصف النساء الحوامل من عدم الحصول على رعاية طبية متخصصة في هذا المجال. ومع ذلك، يبدو أن الأمور تغيّرت بفضل FADA، وهو نموذج رؤية ولغة موحد مبني على قاعدة Qwen3.5-VL.
يعمل FADA على توفير حل شامل لتحليل صور الأشعة الصوتية، حيث يجمع بين وظائف التفسير، التصنيف، الكشف، والتجزئة، وكل ذلك من خلال تجربة واحدة دون الحاجة لتسميات خارجية. عبر استخدام تقنية التقطير الانتقائي، يمكن للنموذج محاذاة الميزات التي تسهم في تحقيق دقة عالية في النتائج، وقد أظهرت الاختبارات أن النسخة الموصى بها FADA-SKD تحقق معدل Dice يصل إلى 0.8820 لتجزئة الصور، ومعدل 0.7671 للكشف مع تلبية متطلبات التفسير بدقة تصل إلى 100%.
علاوة على ذلك، تم التحقق من دقة النتائج من قبل مختصي الأشعة الصوتية عبر تقييم 237 صورة، حيث حققت 73.5% من التفسيرات درجات مثالية تحت إشراف المتخصصين. والجدير بالذكر أن FADA يمكن تدريبه على أجهزة (GPU) للمستهلك، ويتم نشره دون الحاجة للاتصال بالإنترنت، مما يجعله مثاليًا للاستخدام في البيئات ذات الموارد المحدودة.
لقد أثبتنا أيضًا إمكانية استخدام النموذج المحسن فقط على هواتف ذكية عادية، حيث تم تشغيل النموذج المضغوط بفاعلية على هاتف (Qualcomm Snapdragon 7 Gen 1) في حوالي 60 ثانية بشكل كامل دون الحاجة للاتصال بالإنترنت. تعتبر هذه التطورات خطوة كبيرة نحو معالجة الفجوات في الوصول إلى خدمات التشخيص الصحي، خاصة في البيئات التي تعاني من قلة الموارد. للمزيد من المعلومات، يمكن زيارة رابط المشروع على GitHub.
FADA: ثورة في تحليل صور الأشعة الصوتية للجنين بذكاء اصطناعي موحد!
تقدم FADA نموذج رؤية ولغة موحد يقوم بتحليل صور الأشعة الصوتية للجنين بشكل مبتكر وسريع، مما يلبي احتياجات الفحص الطبي في المناطق ذات الدخل المنخفض. يتيح هذا النموذج المبتكر الحصول على تشخيصات دقيقة دون الحاجة للاتصال بالإنترنت.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
