تشهد مجالات الصحة النفسية والسلوكيات الصحية تحولاً ملحوظًا بفعل الابتكارات الحديثة في الذكاء الاصطناعي، حيث تم تصميم أنظمة متعددة الخطوات أو متعددة العملاء من أجل تحسين دقة تقييم مخاطر السلوك الانتحاري والكشف عن الاكتئاب. لكن، يواجه التقييم التقليدي لهذه الأنظمة، مثل استخدام نماذج اللغات الضخمة (Large Language Models) كقضاة، تحديات كبيرة تتمثل في عدم القدرة على تحديد متى يكون القرار موثوقًا أو كيف يمكن أن تتراكم الأخطاء عبر أحكام متعددة، مما يحد من ملاءمتها في البيئات الحرجة من ناحية السلامة.

لتجاوز هذه العقبات، قدم الباحثون إطارًا إحصائيًا لأنظمة متعددة العملاء، مهيكلة كرسوم بيانية موجهة غير دورانية (Directed Acyclic Graphs – DAGs)، مما يقدم بديلًا قويًا لصيغ التصويت التقليدية. في هذا النموذج، يتم تمثيل كل عميل كقرار تصنيفي عشوائي، حيث تمثل هذه الطريقة (1) حدود ثقة أكثر صرامة لأداء كل عميل، (2) استراتيجية أخذ عينات تكيفية تعتمد على صعوبة المدخلات، و(3) ضمانات قلق عبر النظام متعدد العملاء، والتي تبين نموًا لوغاريتميًا في الأخطاء عند استخدامه.

تم تقييم النظام المقترح على مجموعتين بيانات متعلقتين بالصحة النفسية: مجموعة بيانات AEGIS 2.0 (N=161) وعينة مصنفة من منشورات Reddit (N=250). وفي الخطوات العملية، أثبتت الاستراتيجية الحالية أدنى معدل إيجابيات خاطئة على الإطلاق، حيث بلغت 0.095 في مجموعة بيانات AEGIS 2.0، مقارنةً بـ 0.159 لنماذج العميل الواحد، مما أدى إلى تقليص الإشارة الخاطئة للمحتوى الآمن بنسبة 40% مع الحفاظ على معدلات سلبية خاطئة مماثلة عبر جميع الظروف.

هذه النتائج تشير بوضوح إلى أن التصاميم القابلة للتكيف تمثل تحسنًا ملحوظًا في الدقة دون تقليص مقدار الاستدعاء في هذه البيئة، مما يجعلها خطوة هامة نحو تحسين السلامة والدقة في تقييم مخاطر السلوك الانتحاري.