في عصر الذكاء الاصطناعي والتطورات التقنية، يشكل استنساخ الصوت (Voice Cloning) أحد المجالات المتقدمة التي تفتح آفاقاً جديدة لفهم الصوت البشري. لكن، ماذا عن تأثير اللهجات على جودة الاستنساخ؟ دراسة حديثة تناولت الفروقات بين النطق القياسي واللكنات الثقيلة في اللغة الصينية المندرينية، متناولةً الجوانب السمعية والإدراكية.

استخدمت الدراسة تصاميم حسابية وإدراكية لمقارنة الكلام القياسي مع نظيره باللهجة الثقافية، حيث أظهرت نتائج التحليل أن الفجوة بين الأصوات الأصلية والصوت المستنسخ كانت أكبر للمتحدثين باللهجات في عدة مجالات تمييز الصوت. إلا أن هذه الفروق اندفعت بعد تطبيعها مع التباين الموجود لدى كل متحدث.

فيما يخص الدراسة الإدراكية، أظهرت نتائجها أن الصوت المستنسخ يُقيَّم بأنه أكثر شبهاً بالأصلي في حالة المتحدثين القياسيين مقارنة بالمتحدثين باللهجات. كما لوحظ أن قابلية الفهم تزداد من النسخة الأصلية إلى النسخة المستنسخة، مع تحقيق زيادة أكبر في اللهجات.

تشير هذه النتائج إلى أن تنوع اللهجات يمكن أن يؤثر على إدراك الهوية الصوتية وجودة الفهم في استنساخ الصوت، مما يحثنا على أهمية معالجة الحفاظ على اللكنة كعنصر أساسي في الحفاظ على هوية المتحدث بدلاً من افتراض أنه يتم التقاطه بالكامل من خلال أدوات تمييز الصوت العادية.