في عالم تكنولوجيا الصوت، تظل التقييمات الكمية لجودة الصوت (Mean Opinion Scores - MOS) من أبرز الوسائل المستخدمة لتحديد جودة التفاعلات الصوتية. ومع ذلك، تُظهر هذه المؤشرات الحساسية الكبيرة للتباين بين المقيمين والاختلافات في اختبارات الاستماع، مما يؤدي إلى دخول ضوضاء في عملية التقييم ويحدد موثوقية النتائج.

لذا، كان هناك حاجة ملحة لتقنيات جديدة قادرة على تقليل هذه الفجوات. هنا يأتي دور نظام PrefSQA (Pairwise Preference Prediction for Speech Quality Assessment) الذي يعد بمثابة ثورة في تقييم جودة الصوت. تعتمد هذه الطريقة على مقارنة الأصوات بشكل مباشر بين المستخدمين، مما يساعد على إنتاج علامات تقييم أنظف وأكثر دقة.

تستند الدراسة على تطوير نماذج لا تحتاج إلى تقديرات موسعة (MOS-free) وتدمج مفهوم عدم اليقين في النماذج، إلى جانب استخدام رأس اهتمام حول انحرافات الصوت. تم تجربة وتعديل خمسة مجموعات بيانات، تشمل مجموعات مستنبطة من MOS وأخرى ذات ضوضاء منخفضة، بالإضافة إلى اختبارات مع محتوى متطابق وغير متطابق.

أظهرت التجارب تحسناً بسيطاً في البيانات المستندة إلى MOS، بينما أظهرت المجموعات الأخرى تحسناً واضحاً مقارنة بالأسس السابقة، مما يبرز أهمية بيانات التفضيل عالية الجودة ويؤكد فعالية النهج المقترح.