في عصر تزايد الاعتماد على الذكاء الاصطناعي وتحليل البيانات في القطاع الصحي، تبرز أهمية فهم كيفية تشكيل بيانات السجلات الصحية الإلكترونية (Electronic Health Records - EHR) لأساليب اكتشاف السلوكيات الانتحارية. في دراسة جديدة تناولت مجموعة بيانات ScAN المأخوذة من ملاحظات السجلات السريرية في نظام MIMIC-III، تم استكشاف كيف يمكن أن تؤثر العوامل المختلفة، مثل مؤلفي البيانات وحدود المواقف، على نتائج الكشف.

تُظهر النتائج أن القيود الحكومية، واختيار المجموعات بناءً على التصنيفات الدولية للأمراض (ICD)، والتوسيم من قبل مُعالج واحد، وتجميع البيانات بناءً على مدة الإقامة في المستشفى، قد ينتجون تسميات تعكس حكم الأطباء أكثر مما تعكس الحقيقة الواقعية للسلوكيات الانتحارية. كما تكشف التحليلات اللغوية أن تسميات متطابقة قد تغطي أطرًا سريرية متنوعة تختلف في الزمن، والنفي، وعدم اليقين.

ويشير الباحثون إلى أهمية فحص الافتراضات المدمجة في مجموعات بيانات الانتحارية قبل الاعتماد على تسمياتها كحقيقة مطلقة. هذا النقاش يدفعنا لنفكر بطريقة نقدية في كيفية معالجة الذكاء الاصطناعي لقضايا حساسة مثل السلوكيات الانتحارية ويحفزنا على إعادة النظر في كيفية استخدام البيانات السريرية في الأبحاث المستقبلية.