تعتبر مشكلة صعوبة الترجمة (Untranslatability) من التحديات الكبرى التي تواجه المترجمين وعلماء اللغة على حد سواء. هذه الظاهرة تشير إلى الحالات التي يصعب فيها الحفاظ على المعنى عند الانتقال من لغة إلى أخرى. بينما تم استكشافها بشكل جيد في علم اللغويات، إلا أنها لا تزال تعتبر منطقة غير مدروسة بما فيه الكفاية في مجال معالجة اللغة الطبيعية (Natural Language Processing).

مع تحسن أنظمة الترجمة الآلية (Machine Translation) على المعايير القياسية، بدأت عيوبها تتجلى أكثر في حالات الترجمة غير الممكنة، حيث لا يمكن تقليل الترجمة إلى معادلة مباشرة واحدة. في هذا الاتجاه، قدم الباحثون هيكلًا جديدًا لفهم صعوبة الترجمة يتضمن تصنيفًا منظمًا للحالات غير القابلة للترجمة، مع استراتيجيات تعويض محددة تساعد على إيصال المعاني في هذه السياقات.

يسهم هذا الإطار في إنشاء مجموعة بيانات متعددة اللغات تحتوي على جمل غير قابلة للترجمة مُرفقة بترجمات تعتمد على استراتيجيات معينة. يتيح ذلك تحليلًا دقيقًا لسلوك الترجمة. تشير الدراسات الأولية حول تفضيلات البشر إلى أن جودة الترجمة تعتمد على الاستراتيجية المستخدمة، وتفضل النتائج التي تتضمن سياقًا توضيحيًا، وهي ما تُعرف باستراتيجية تعويض التعليق (Annotation compensation strategy).

مع هذا الإطار ومجموعة البيانات، يتم وضع أساسٍ لدراسة نماذج الترجمة الآلية المدعومة بالاستراتيجيات، مما يفتح آفاقًا جديدة لفهم كيفية تعامل الذكاء الاصطناعي مع الترجمة.