تستمر الفجوات في الرعاية الصحية عبر الحدود الاقتصادية والاجتماعية، وغالبًا ما يُنسب ذلك إلى عدم المساواة في الوصول إلى الإجراءات الطبية مثل الفحص والتشخيص والعلاج. لكن هذه النظرة الجديدة تسلط الضوء على أن الانحيازات الهامة يمكن أن تظهر في مراحل سابقة بكثير، وتحديدًا خلال جمع البيانات وتحديد أولويات الأبحاث، قبل أن تُطبق إكلينيكيًا.

فبينما يركز العديد من الدراسات على جمع بيانات "الأوميكس" (Omics)، فإن المعلومات الديمغرافية المرتبطة بهذه البيانات غالبًا ما تتجاهل، وعندما يتم الإبلاغ عنها، تكشف عن انحيازات كبيرة من حيث التنوع. فقد أجرينا تحليلًا تلقائيًا لـ 4514 منشورًا في قاعدة بيانات PubMed مصنفة تحت الأوميكس من 2015 إلى 2024، واكتشفنا أن الإبلاغ عن المعلومات الديمغرافية كان محدودًا؛ حيث لا يظهر سوى 2.7% من الدراسات معلومات عن السلالة أو العرق، وبلغت نسبة الإبلاغ عن الأصل الجغرافي 2.5%.

كما أن البيانات المستخدمة عادةً لتدريب النماذج، مثل CellxGene وGEO، تُظهر انحيازًا سكانيًا ملحوظًا حيث تهيمن بيانات أصول أوروبية. ومع ظهور نماذج الذكاء الاصطناعي الطبية لتصبح مركزية في اكتشافات الطب الحيوي، هناك خطر من استمرار أو تعزيز هذه الانحيازات المبكرة، مما يؤدي إلى تفاقم الفجوات التي لا يمكن للتدخلات التنظيمية عكسها بشكل كامل.

لذا، نحن نوصي بتركيز مجتمعي على ثلاثة مبادئ أساسية: "Provenance" (الأصل)، "Openness" (ال openness)، و"Reliability" (الموثوقية) من خلال "Evaluation Transparency" (شفافية التقييم). معًا، يمكن لهذه المبادئ أن تساعد في جعل الانحيازات والقيود أكثر وضوحًا لمطوري النماذج والمستخدمين، دعمًا لاتخاذ قرارات أكثر وعيًا بشأن تطوير وتقييم ونشر نماذج الذكاء الاصطناعي في مجال الطب الحيوي.