نجحت نماذج اللغات الضخمة (LLMs) في تحقيق تقدم ملحوظ عبر مجموعة واسعة من المهام، إلا أن اعتمادها الكبير على بيانات التدريب التي تركز على اللغة الإنجليزية أدى إلى تراجع أداء ملحوظ في اللغات الأخرى. بينما تركز الأساليب الحالية على إعادة صياغة الاستفسارات إلى اللغة الإنجليزية أو تحسين القدرات الاستدلالية، فإنها غالباً ما تفشل في تضمين القاعدة الثقافية واللغوية التي تعد ضرورية لبعض الاستفسارات.
للتغلب على هذه القيود، قدم الباحثون إطار EMCEE (Extracting synthetic Multilingual Context and merging) كإطار بسيط ولكنه فعال يعزز من القدرات متعددة اللغات لنماذج اللغات الضخمة من خلال استخراج وتوظيف المعرفة ذات الصلة بالاستفسار من النموذج نفسه.
يعمل EMCEE على استخراج سياق اصطناعي يكشف عن المعرفة العميقة المخصصة للغة المخزنة داخل النموذج، ثم يقوم بدمج هذه الرؤية السياقية بشكل ديناميكي مع المخرجات الموجهة نحو الاستدلال عبر آلية اختيار قائمة على الحكم.
أثبتت التجارب الشاملة على أربعة معايير متعددة اللغات تغطي لغات ومهام متنوعة أن EMCEE يتفوق باستمرار على الطرق السابقة، محققًا تحسينًا نسبيًا متوسطًا بنسبة 16.4% بشكل عام و31.7% في اللغات ذات الموارد المحدودة. هذا الابتكار يمثل خطوة قوية نحو تجاوز العوائق اللغوية وجعل التكنولوجيا أكثر شمولًا للجميع.
ما رأيكم في هذه التطورات المثيرة؟ شاركونا في التعليقات.
EMCEE: ثورة جديدة في تعزيز قدرات نماذج اللغات الضخمة متعددة اللغات
تقدم دراسة جديدة إطار EMCEE الذي يعزز من قدرات نماذج اللغات الضخمة عن طريق استخراج المعرفة السياقية المتعددة اللغات. هذا الابتكار يحقق تحسينات ملحوظة، وخاصة في اللغات ذات الموارد المحدودة.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
