تُعتبر توقعات صعوبة الكلمات (Lexical Difficulty Prediction) من القضايا الأساسية في تعلم اللغات وتقييم قابلية القراءة. إذ تتطلب النماذج القدرة على تقدير صعوبة الكلمات بين مختلف خلفيات اللغة الأم (L1). ورغم ذلك، فإن الطرق الحالية تعتمد على التدريب باستخدام الانحدار فقط تحت إشراف عددي، مما يحد من قدرتها على هيكلة فضاء التمثيل بشكلٍ صريح.

في سعيهم للتغلب على هذه التحديات، اقترح الباحثون تقنية جديدة تُعرف بالتعلم المتباين المتوافق مع السياق (Context-Aligned Contrastive Regression)، والتي تضمّ تقنية الانحدار Ridge (Ridge Regression) مع هدفين تكميليين. الأول هو 'السياق المتعدد المناظر' (Cross-View Context) والثاني هو 'التعلم المتباين اللفظي الناعم المرتب' (Ordinal Soft Contrastive Learning).

أظهرت التجارب التي أُجريت على ثلاثة مجموعات بيانات من خلفيات لغوية مختلفة أن: (1) الأهداف المتباينة تعمل على تحسين تآزر التمثيل عبر اللغات مع الحفاظ على جوانب خاصة بكل لغة، (2) التمثيلات المكتسبة تُظهر هيكلية مرتبة لصعوبة الكلمات، و(3) الهيئة التجميعية تُخفف بشكل فعال من الميول النظامية للنماذج الفردية، مما يؤدي إلى أداء أكثر استقرارًا عبر مستويات الصعوبة المختلفة. هذه النتائج تفتح آفاقًا جديدة لتطبيق تقنيات الذكاء الاصطناعي في تعلم اللغات وتحسين تجربة المتعلمين.