في عالم أبحاث العمليات، يعتبر التعامل مع النماذج غير القابلة للحل أمرًا معقدًا يتطلب جهدًا مستمرًا. وذلك لأن الممارسين غالبًا ما يجدون أنفسهم في حلقة تتطلب فحص الأنظمة غير القابلة للاختزال (Irreducible Infeasible Subsystems - IIS)، وتحديد النزاعات المتعلقة بالقيود، وإصلاح الصيغ حتى يتم استعادة القابلية للحل. ومع ذلك، تتجاهل المقاييس الحالية لنماذج اللغة الضخمة (Large Language Models - LLM) هذا الدور التشخيصي، حيث تركز على تحويل وصف المشكلة إلى كود دون الأخذ بعين الاعتبار الحلول iterative.

لكن الآن، قدم فريق من الباحثين حلاً مبتكرًا يتمثل في ORLoopBench. يتمثل الحل في اعتبار عملية تصحيح النماذج غير القابلة للحل كعملية اتخاذ قرار ماركوفية يمكن تنفيذها، حيث يؤدي كل إجراء إلى إعادة تشغيل المحلل وإعادة حساب IIS، مما يوفر ملاحظات دقيقة وقابلة للتحقق.

يتكون ORLoopBench من مجموعتين رئيسيتين: OR-Debug-Bench التي تطلق 5362 حالة إصلاح لـ LP/MILP، وOR-Bias-Bench التي تقيم عقلانية اتخاذ القرار التشغيلي في إعدادات المخزون. لقد أظهر التدريب المدعوم من المحلل المعتمد (Solver-verified RLVR training) أن نموذج 8B يمكنه تجاوز واجهات برمجة التطبيقات المتقدمة في إصلاح LP بنسبة 95.3% مقارنة بـ 92.4%، مما يحسن السلوك التشخيصي ويحقق تحويلاً إلى إصلاح MILP.

من المهم أيضًا ملاحظة أن التقييم يكشف عن انحراف دلالي في تجديد النماذج الكاملة: حيث يمكن أن تحل MILPs المجددة القابلة للحل مشكلة خاطئة. لذا، يوفر التقييم على مستوى العملية بالتعاون مع خبراء الحلول تدريبًا مستهدفًا من أجل تصحيح موثوق في أبحاث العمليات.

تقدم ORLoopBench آفاقًا جديدة لتحسين دقة النماذج وتعزيز كفاءة العمليات. ما رأيكم في هذا التطور المثير؟ شاركونا في التعليقات!