في عصر تتزايد فيه أهمية التواصل المتعدد اللغات، ظهر الكود المختلط الروماني (RCM) كأسلوب رئيسي يدمج بين اللغات المحلية واللغة الإنجليزية باستخدام الكتابة الرومانية. يعد هذا الشكل من الكود المختلط نقطة مركزية في طرق التواصل بين المتحدثين باللغات الهندية، ولكن مدى قدرة النماذج اللغوية الكبيرة (Large Language Models) على معالجة هذا النوع من المحتوى لم يتم استكشافه بشكل كافٍ حتى الآن.
مؤخراً، تم تقديم معيار Indi-RomCoM، والذي يسعى لتقييم أداء النماذج اللغوية الكبيرة في التعامل مع التعليمات المرتكزة على الكود المختلط الروماني. يشمل هذا المعيار سبعة مهام تتعلق باتباع التعليمات، وأربعة لغات هندية واسعة الاستخدام، وثلاث مستويات للتحكم في كثافة الكود المختلط.
من خلال تقييم مجموعة من النماذج اللغوية الكبيرة، بما في ذلك النماذج التجارية والنماذج المفتوحة والنماذج المخصصة للاستخدام الهندي، تم اكتشاف أن هذه النماذج تظهر أداءً ضعيفًا عند التعامل مع التعليمات المختلطة. كما أظهرت النتائج أن الأداء يتدهور كلما زادت كثافة الكود المختلط. في المقابل، عانت مهام التفكير من تدهور أقل مقارنة بمهام الكشف، حيث توفر التفسيرات الناتجة السياق الضروري.
يأمل الباحثون أن يُسهم معيار Indi-RomCoM في تطوير أنظمة متعددة اللغات تكون أكثر شمولية واستدامة في التواصل. هل أثر هذا الخبر في رؤيتك للأنظمة اللغوية المتعددة؟
ثورة في الذكاء الاصطناعي: معيار Indi-RomCoM لتقييم النماذج اللغوية الكبيرة!
الكود المختلط الروماني (RCM) أصبح أسلوب الاتصال الرئيسي بين المجتمعات المتعددة اللغات. يقدم معيار Indi-RomCoM تقييمًا شاملًا لقدرة النماذج اللغوية الكبيرة (LLMs) على معالجة التعليمات المختلطة. اكتشفوا المزيد حول تأثير هذا المعايير في تطوير الأنظمة متعددة اللغات.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
