في عصر تتزايد فيه تحديات التزوير الصوتي، يبرز dataset جديد يعيد تعريف أساليب الكشف عن الأصوات المزيفة، وهو يُعرف بـ 'Linguistically Augmented Audio Speech Data (LinguAS)'. يهدف هذا النظام إلى مواجهة الأخطار المتزايدة الناتجة عن الصوت المزيف، بما في ذلك تكتيكات الdeepfake والأصوات المفبركة.
عن طريق الابتكار في البيانات، يتضمن 'LinguAS' أكثر من 800 عينة صوتية حقيقية ومزيفة تم تصنيفها باستخدام خمسة ميزات لغوية مُعرفة من قبل خبراء (Expert-Defined Linguistic Features - EDLFs). هذه الميزات مرتبطة بطبيعة اللغة المنطوقة في الإنجليزية، مما يساعد على تعزيز دقة نماذج الكشف عن الأصوات المزيفة.
يمتاز هذا dataset بتوازن في عدد الأنواع الأربعة لهجمات الصوت المزيف، مع المحافظة على نسبة مناسبة من عينات الكلام الحقيقية. بالإضافة إلى ذلك، يتضمن 'LinguAS' بيانات وصفية تمكّن الباحثين من التعرف على جنس المتحدث والمولد أو المصدر لكل عينة مزيفة، مما يقدم تفاصيل إضافية تعزز من فعالية نماذج التعلم.
أظهرت التجارب أن النماذج التي تم تدريبها على بيانات مليئة بـ EDLFs قد حققت أداءً متقدماً وبصورة ملحوظة، متجاوزة مستويات الأساس السابقة التي تم استخدامها في مسابقات ASVspoof 2021. توفر هذه البيانات الغنية بسمات لغوية، وجنس المتحدث، ومولد الصوت فهماً أعمق للغة البشرية، مما يؤدي إلى تحسين دقة نموذج الكشف عن الأصوات المزيفة.
مستقبل المعلومات الصوتية يبدو أكثر أماناً بفضل الابتكارات الجديدة، ونتطلع جميعاً إلى رؤية كيفية تفاعل الأبحاث المستقبلية مع dataset 'LinguAS'.
تقنية مبتكرة: مكافحة الصوت المزيف باستخدام بيانات لغوية معززة!
يظهر dataset الجديد 'Linguistically Augmented Audio Speech Data (LinguAS)' تطوراً مهماً في مكافحة الصوت المزيف. مع أكثر من 800 نموذج صوتي، ستعزز هذه البيانات دقة نماذج الكشف عن التزوير الصوتي وتحسن أداءها بشكل ملحوظ.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
