في عالم تتزايد فيه متطلبات التحسين في مجالات مثل اللوجستيات والتصنيع والطاقة والمالية، يظل تحويل المتطلبات اللغوية الطبيعية إلى صيغ رياضية دقيقة مهمة شاقة ومستهلكة للوقت. لقد تم استكشاف استخدام نماذج اللغات الضخمة (Large Language Models) لهذه المهمة، ولكنها تواجه تحديات كبيرة في التقييم، حيث تهيمن المعايير الصغيرة أو الاصطناعية، مما يخفي الصعوبات الحقيقية التي تتضمنها المشاكل الصناعية التي تحتوي على آلاف المتغيرات والقيود.

لتجاوز هذه العوائق، قدم الباحثون معيارًا جديدًا يسمى MIPLIB-NL، تم إنشاؤه من خلال منهجية بناء عكسي مدروسة تستند إلى البرامج الخطية المختلطة الحقيقية من MIPLIB 2017. هذه المنهجية تتضمن:
1. استعادة بنية نموذجية قابلة لإعادة الاستخدام من الصيغ المسطحة.
2. إنشاء متطلبات لغوية طبيعية مرتبطة بشكل صريح بهذه البنية تحت صيغة موحدة لفصل النموذج والبيانات.
3. إجراء تأكيد دلالي متكرر من خلال مراجعة الخبراء والتفاعل بين الإنسان ونموذج اللغة الكبير مع تدقيقات مستقلة لإعادة البناء.

لقد أنتجت هذه العملية 223 إعادة بناء متطابقة تحافظ على المحتوى الرياضي للحالات الأصلية، مما يتيح تقييمًا واقعيًا لتحويل اللغات الطبيعية إلى نماذج تحسين. أظهرت التجارب أن أداء النظم على MIPLIB-NL قد انخفض بشكل ملحوظ مقارنةً بالمعايير الحالية، مما يكشف عن أنماط فشل لم تكن مرئية عند النطاقات الصغيرة.

هذا الإنجاز يعد تحولًا حقيقيًا في كيفية تعامل الروبوتات ونماذج الذكاء الاصطناعي مع تحديات الأعمال المعقدة، مما يمكننا من تحسين الدقة والكفاءة في صناعة القرار.