في عالم الدعم النفسي، تزايد الاعتماد على الذكاء الاصطناعي (AI) كجزء من العملية العلاجية، مما يطرح تساؤلات حول كيفية تقييم جودة استجابة المعالجين الآليين. في ورقة بحثية حديثة، تم النظر في إمكانية تقييم حوارات الدعم المتعددة المجالات دون الاعتماد على نماذج لغوية ضخمة (Large Language Models) كمقاييس نهائية.
بدلاً من ذلك، استخدم الباحثون نموذجًا مبنيًا على نماذج LLM كخط أساس، حيث يتعامل مع نصوص الحوار الخام ويتنبأ بما إذا كانت الاستجابة المستهدفة ضارة، منتجة، أم حيادية. ومع ذلك، وجدت الدراسة أن هذه المقاييس لم تكن متوافقة جيدًا مع جودة العلاج، نظرًا للاعتماد على الاتجاه السريري للاستجابة.
للتغلب على هذه التحديات، تم تقديم نموذج جديد يعرف باسم الرسوم البيانية الديناميكية للتوقيع العاطفي (Dynamic Emotional Signature Graphs - DESG). يهدف هذا النموذج المبتكر إلى تقييم الحوارات من خلال تمثيلها بحالات سريرية منفصلة واحتساب العلامات باستخدام هندسة سريرية غير متزامنة.
خضعت DESG لاختبارات صارمة على مجموعة من 3,000 نافذة حوار من مصادر متنوعة مثل EmpatheticDialogues وESConv وCRADLE-Dialogue، وعالجت مواضيع متنوعة من الدعم النفسي إلى الحوارات الموجهة لأزمات. في الاختبار الذي شمل 600 نافذة، حققت مجموعة DESG-Ensemble معدل 0.9353 في F1 الماكرو، متفوقةً على نموذج ConcatANN بمقدار 1.51 نقطة، وعلى BERTScore بفارق 19.63 نقطة، وعلى TRACT بفارق 33.81 نقطة.
تجري الدراسة أيضًا أنماط تفاعل متعددة، والتحكم في التباين، وتقييمات من حَكَم مُعمي على 100 نافذة، مما يظهر أن المنحنى السريري هو العنصر الفعال الرئيسي، بينما توفر مكونات مسار الرسوم البيانية تقييمات غير متزامنة وتشخيصات يمكن فهمها دون أن تكون المصدر الوحيد للأداء.
كشف النفاق الخفي في حوارات الصحة النفسية باستخدام الرسوم البيانية الديناميكية للعواطف
تستكشف هذه الورقة البحثية طرق جديدة لتقييم جودة الاستجابة العلاجية في حوارات الذكاء الاصطناعي دون الاعتماد على نماذج لغوية ضخمة. يتم تقديم نموذج مبتكر يدعى الرسوم البيانية الديناميكية للتوقيع العاطفي الذي يوفر تقييمًا دقيقًا للحالة السريرية.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
