يشكل خطاب الإنسان نافذة فريدة لمراقبة صحة الفرد، حيث يجمع بين عدة أنظمة مثل العصبية والحركية والتنفسية. ومع تقدم أساليب الذكاء الاصطناعي في الخطاب السريري، إلا أن معظم الأبحاث كانت تركز على دراسات منفصلة حول حالات مرضية محددة، مما يصعب المقارنة بين النتائج.

يُقدم لنا معيار SpeechDx كمحطة جديدة في هذا المجال، حيث يتضمن 12 مجموعة بيانات و27 مهمة مختلفة تتعلق بصحة الإنسان. هذا المعيار يهدف إلى تمكين تقييم أكثر دقة من خلال هيكلة المهام بناءً على مراحل إنتاج الخطاب المتأثرة بالاضطرابات: التصور، الصياغة، والنطق.

تمت تجربة هذا المعيار باستخدام 12 نموذجاً من أحدث تقنيات تحليل الصوت، وتم تقييم الأداء في نقل المعرفة بين الحالات المختلفة. أظهرت النتائج أن النماذج الكبيرة التي تتعامل مع اللغة تمثل القاعدة الأقوى بشكل عام. ومع ذلك، فإن تحسين الأداء مع النماذج المتخصصة كان محصوراً في المهام المتقاربة فقط، مما يشير إلى أن لا تمثيل حالياً يمكنه التعميم بشكل موثوق عبر مشهد الخطاب السريري.

توفر SpeechDx إطاراً موحداً لتتبع التقدم نحو تمثيلات عامة لذكاء الاصطناعي في الخطاب، مما يشير إلى خطوات هامة في مجال الدراسات السريرية.