في عصر تتسارع فيه التطورات في مجال الذكاء الاصطناعي (AI)، يظهر مشروع VERA-MH (تقييم الذكاء الاصطناعي الأخلاقي والمسؤول في الصحة النفسية) كنموذج رائد يجمع بين التقنية والممارسات الصحية. يهدف هذا النظام الآلي إلى تقييم سلامة روبوتات الدردشة في سياقات الصحة النفسية، مع تركيز خاص على مخاطر الانتحار.

تطور المشروع من قِبَل مختصين في الصحة النفسية وأكاديميين، حيث تم تطوير معيار يعتمد على أفضل الممارسات لإدارة مخاطر الانتحار لتقييم الروبوتات. ولتسهيل العملية، تم استخدام نموذجين من الذكاء الاصطناعي: نموذج المستخدم الذي يحاكي محادثة مع الروبوت، ونموذج القاضي الذي يقوم بتقييم المحادثات بناءً على المعايير السابقة.

يتضمن نموذج المستخدم تمثيلاً لشخصيات مختلفة بمستويات مخاطر محددة، مما يتيح تقييم الروبوتات في سيناريوهات متعددة. تُجمع الدرجات الممنوحة لكل محادثة لتقديم تقييم نهائي للأداة التي يتم اختبارها. حاليًا، يخضع VERA-MH لعمليات تحقق صارمة من مختصين في الصحة النفسية لضمان أن يقوم نموذج المستخدم بتقليد سلوك المرضى بدقة وأن نموذج القاضي يقيم الخوارزمية بشكل صحيح.

حتى الآن، تم إجراء تقييم أولي لروبوتات مثل GPT-5 وClaude Opus وClaude Sonnet باستخدام النسخ الأولية من معيار VERA-MH، وتم استخدام النتائج لتطوير التصميم بشكل أكبر. تشمل الخطوات القادمة مزيدًا من التحقق السريري وتحسين معايير التقييم.

نسعى للحصول على ملاحظات من المجتمع حول جوانب التقييم الفنية والسريرية، وذلك لضمان تحسين وتطوير الأدوات المستخدمة في الصحة النفسية.