في السنوات الأخيرة، أصبحت منهجية الذكاء الاصطناعي المعتمدة على البيانات (data-centric AI) نموذجًا سائداً في تحليل بيانات خلايا الفردية (single-cell transcriptomics)، حيث تُعتبر تمثيلات البيانات بدلاً من تعقيد النموذج العائق الأساسي. في مراجعة الدراسات الحالية، نجد أن الطرق التقليدية كانت تتعامل مع الخلايا ككيانات مستقلة، متبعة نماذج تعلم الآلة السائدة لتحليل البيانات الوراثية المُورّثة منها. ورغم بساطتها، تفوّت هذه الطرق العلاقات الخفية بين الخلايا الناتجة عن الآليات الوظيفية للأنظمة البيولوجية، بالإضافة إلى القضايا النوعية المتعلقة ببيانات التسلسل الخام.
بالتالي، ظهرت سلسلة من الطرق المنظمة. ورغم أنها تستعمل قواعد متعددة لاستنتاج العلاقات البيولوجية المعقدة وتعزيز البيانات الخام، فإنها غالبًا ما تتجاهل المعرفة البيولوجية السابقة، مما يؤدي إلى تحميل زائد وعرض رسومات بيانية دون المستوى المطلوب، مما يعيق فائدة نماذج تعلم الآلة.
لمعالجة هذه المشكلات، نقترح DOGMA، إطارًا معتمدًا على البيانات مصمم لإعادة تشكيل البيانات الهيكلية وتعزيز دلالتها من خلال معرفة بيولوجية متعددة المستويات. يتجاوز DOGMA الاعتماد على القواعد المعتمدة فقط على البيانات، ويتيح إمكانية بناء رسومات بيانية مدفوعة بالمعرفة السابقة، حيث يجمع بين التوافق الإحصائي وCell Ontology (علم تصنيف الخلايا) والبنية النشوء التطوري لإنشاء رسومات بيانية بيولوجية قوية وضمان توافق متعدد الأنواع.
علاوة على ذلك، يتم استخدام Gene Ontology (علم تصنيف الجينات) لسد الفجوة الدلالية على مستوى الميزات عن طريق دمج المعلومات الوظيفية. في اختبارات متعددة الأنواع والأعضاء، يظهر DOGMA قوة كبيرة في تقييم نوع الخلايا بدون بيانات سابقة وكفاءة في استخدام العينات بينما يستخدم ذاكرة GPU أقل بكثير ووقت استدلال أقل في تقييماتهم القادمة.
اكتشاف جديد في علم الجراثيم: DOGMA يغير طريقة تحليل بيانات خلايا الفردية!
الإطار الجديد DOGMA يحل المشاكل الحالية في تحليل بيانات خلايا الفردية من خلال دمج المعرفة البيولوجية في معالجة البيانات. يعد هذا التطور نقلة نوعية في تقنيات الذكاء الاصطناعي المعتمدة على البيانات.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
