في عالم يتطور بسرعة بفعل التقدم التكنولوجي، دخلت نماذج الذكاء الاصطناعي المجال الطبي من خلال تقنية جديدة تُعرف باسم DALPHIN. هذه التقنية تمثل معياراً مفتوحاً يُتيح مقارنة أداء مساعدي الذكاء الاصطناعي مع الأطباء المختصين.

تتألف مجموعة بيانات DALPHIN من 1236 صورة فريدة تغطي 300 حالة طبية، مما يشمل 130 تشخيصًا مختلفًا تتراوح بين النادرة والشائعة. تم جمع هذه البيانات من 6 دول مختلفة، مما يجعلها واحدة من أكبر المبادرات متعددة المراكز في هذا المجال.

ما يميز DALPHIN هو الإطار الذي تم تصميمه لتقييم كل من أداء الذكاء الاصطناعي والأطباء البشر. فقد تم اختبار 31 خبيرًا في مجال علم الأمراض من 10 دول، مما يوفر مرجعية متنوعة للاختبارات.

نتائج الدراسة أظهرت أنه لم تكن هناك فروق ذات دلالة إحصائية في الأداء بين الذكاء الاصطناعي (مثل GPT-5 وGemini 2.5 Pro) وخبراء الطب في أربعة من أصل ست مهام لاختبار PathChat+. في حين سجل Gemini أداءً متميزًا في اثنتين من المهام، بينما كان أداء GPT محدودًا بمهمة واحدة.

يتم إطلاق DALPHIN للجمهور، مما يتيح الوصول إلى البيانات والأساليب عبر dalphin.grand-challenge.org، مما يسهم في تحفيز البحث والتطوير في هذا المجال.

إن هذه الدراسة تعتبر خطوة مهمة نحو فهم مدى قدرة الذكاء الاصطناعي على تقديم المساعدة للأطباء في التشخيصات الروتينية. فهل نحن على أعتاب ثورة طبية تكنولوجية؟