في عالم التكنولوجيا المتسارع، يستمر الابتكار في الظهور في مجالات متعددة، ومن أحدث الصيحات في هذا السياق هي استخدام نماذج اللغة (Language Models) لضغط الصوت. أظهرت دراسة جديدة أن نماذج اللغة التي تم تدريبها على موجات الصوت الخام تستطيع إعادة استخدام تقنياتها لتحقيق ضغط صوت خالٍ من الفقدان.
السابق كان يشير إلى أن جهود ضغط الصوت كانت تقتصر على الجودة 8 بت، مما ترك تساؤلات حول مدى جدوى هذه التقنيات في الإعدادات العملية الأخرى مثل 16 أو 24 بت. ولكن الآن، جاء الحل الثوري الذي يحمل اسم **Trilobyte**، والذي يعتمد على نظام توكنينغ بمستوى البايت (byte-level tokenization) لضغط الصوت بدقة عالية، مما يجعل الأمر ممكناً للمرة الأولى لتحقيق ضغط فعّال على الملفات ذات الـ 24 بت.
انتشرت الاختبارات عبر مجالات متعددة منها الموسيقى والكلام والأصوات البيولوجية، مع معدلات عينة تتراوح بين 16kHz و48kHz. النتائج أظهرت أن نماذج اللغة تفوقت بشكل ملحوظ على برنامج ضغط FLAC الشهير، مقدمةً كفاءة عالية ونتائج غير مسبوقة لكل من 8 بت و16 بت. ومع ذلك، لوحظ أن الفوائد في الضغط تصبح أقل بروزًا عند الارتفاع إلى عمق عينة 24 بت.
تعتبر هذه التطورات خطوة مهمة نحو تحسين تقنيات صحة الصوت، وتتيح لمنتجي الصوت ومطوري التكنولوجيا استخدام نماذج اللغة بطريقة جديدة ومبتكرة. هل ستكون هذه التقنيات هي الجديدة في عالم ضغط الصوت؟
دعونا ننتظر ونرى كيف ستستمر هذه الابتكارات في تشكيل مستقبل الصوت الرقمي.
ثورة في ضغط الصوت: نماذج اللغة تحقق كفاءة غير مسبوقة في جودة الصوت
تستعرض دراسة جديدة كيفية استخدام نماذج اللغة لتحسين ضغط الصوت عالي الجودة وتحقيق نتائج مذهلة في هذا المجال. بفضل تقنية جديدة، يمكن الآن استخدام ضغط صوتي خالٍ من الفقدان بشكل فعّال على ملفات الصوت بدقات مختلفة.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
