تعد التركيب اللغوي الاصطلاحي (Light Verb Constructions) في اللغة التركية تحديًا حقيقيًا لعلوم الكمبيوتر، فهي تسير على نفس السطح الشكلية كالجمل الفعلية التقليدية لكن تحمل معاني عميقة وتأدي معانٍ مختلفة. في دراسة حديثة، تم تناول الموضوع كمسألة تصنيف ثنائي، حيث تم التمييز بين المعاني الحرفية والمعاني الاصطلاحية.
اعتمد الباحثون على مجموعة مضبوطة تم إعدادها يدويًا تحتوي على 147 جملة، وتم اختبار كيف يمكن لنماذج مختلفة أن تكشف عن هذه التعبيرات. تم استخدام نموذج BERTurk كقاعدة تحت إشراف تقليدي، ومن ثم تمت المقارنة مع ثلاث نماذج تعليمية تعتمد على الإيعازات (Instruction-tuned LLMs) تحت ظروف مختلفة مثل التعلم بدون عرض (Zero-shot) ومع عرض واحد (One-shot) وعرض قليل (Few-shot).
أظهرت النتائج أن نماذج LLMs تحقق أداءً جيدًا في تصنيف الجمل السلبية، لكنها تواجه صعوبة كبيرة في استعادة التعبيرات الاصطلاحية، ما يدل على الحاجة الملحة لتقنيات دفع تحفيزية أفضل. بينما حقق العرض الواحد تحسينًا حادًا في الكشف عن التعبيرات الاصطلاحية، إلا أنه أدى أيضًا إلى انحيازات قوية وغير مرغوب فيها. في المقابل، كان العرض القليل أكثر فعالية في تحسين دقة النموذج.
تسلط هذه الدراسة الضوء على أهمية تحفيز المحفزات بشكل سليم في التصنيف اللغوي الميتا في اللغة التركية، مما يجعل النموذج التقليدي تحت الإشراف تنافسيًا بل ويمكن أن يتفوق عليه في تصنيف التعبيرات الاصطلاحية عند استخدام استراتيجيات تحفيزية مُعدّة بعناية.
هل يمكن للتعلم القائم على العرض أن يحسن تصنيف التعبيرات متعددة الكلمات؟ اكتشفوا التفاصيل!
تناقش هذه الدراسة الجديدة تحديات تصنيف التعبيرات الاصطلاحية في اللغة التركية وتظهر كيفية تأثير تقنيات التعلم المختلفة على دقة الكشف عنها. النتائج تعزز أهمية إعداد المحفزات في تحسين الأداء.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
