في عالم الرعاية الصحية، تعتبر توقعات المخاطر الصحية أمرًا حيويًا، وخصوصًا مع التحديات التي تواجهها مثل تنوع البيانات ونقصها وعدم توازن الفئات. تسلط دراسة حديثة الضوء على إطار عمل آلي متقدم يُعرف باسم yvsoucom-iterkit، وهو يمثل نقلة نوعية في هذا المجال.

يتميز هذا الإطار بتصميمه القابل لإعادة الإنتاج، حيث يحاكي عملية تحسين خطوط الأنابيب (Pipeline) كمنظومة متكاملة، مع توفير سجلات قابلة للتتبع. هذا يسمح بإجراء تحليلات منهجية حول كل مكون من المكونات، بما في ذلك التفاعلات والشبه والقدرة على التحمل عبر مختلف القيم.

أجريت الاختبارات على مجموعات بيانات مرض السكري والسكتة الدماغية، حيث تبيّن أن الأداء مستقر ومرتبط بعدد محدود من المكونات المؤثرة. وأظهرت النماذج المجتمعة (Ensemble Models) نجاحًا باهرًا، حيث حققت نسبة Weighted-F1 تبلغ 0.89 لمجموعة بيانات مرض السكري و0.94 للسكتة الدماغية.

ومع ذلك، تعززت المؤشرات العامة مثل Macro-F1 بمعدل حوالي 0.88 للسكري، لكنها تراجعت إلى 0.6560 للسكتة الدماغية بسبب عدم التوازن الحاد. وأثبتت التجارب أن النماذج المجتمعة تعمل على تقليل التباين مقارنة بالنماذج الفردية.

أكد اختبار Friedman ($p < 0.05$) على وجود فروقات هامة في التصنيف بين التكوينات المختلفة، مما يسهم في تحسين الأداء والاستقرار وقابلية التفسير، بينما يقلل من تعقيد البحث غير الضروري. التجربة أظهرت أيضًا كيف تؤثر استراتيجيات التوازن في الأداء، حيث حقق استخدام RandomOverSampler تحسينًا في Macro-F1 من 0.6560 إلى 0.6766 للسكتة الدماغية.

مع هذه النتائج، يتضح أن تحسين AutoML الفعال يمكن تحقيقه من خلال تصميم التكوينات المثلى، حيث يمكن أن تؤدي القيود على نطاق البحث إلى تحسين الأداء والاستقرار وقابلية التفسير في الوقت نفسه.