في عالم يتسارع نحو الأتمتة، تبرز أنظمة الوفاء الذاتي المتنقلة (Robotic Mobile Fulfillment Systems) كحلول مثالية لنقل السلع داخل المخازن بشكل آلي. لكن تحديد كيفية تخصيص الطلبات وجدولة الروبوتات يعتبر تحديًا كبيرًا، خاصةً في ظل القيود الزمنية الصارمة والتعقيدات التي تنشأ من القرارات متعددة المراحل.

للتغلب على هذه التحديات، تم تقديم إطار عمل جديد يُدعى SOAR، الذي يعتمد على أساليب التعلم العميق للتعامل مع تحسين تخصيص الطلبات وجدولة الروبوتات بشكل مشترك وبأداء يتجاوز الطرق التقليدية. من خلال تحويل عملية تخصيص الطلبات وجدولة الروبوتات إلى عملية موحدة باستخدام تخصيصات الطلبات اللينة كمرئيات، يمكن لإطار SOAR التعامل مع الأحداث المتزامنة بكفاءة.

يستفيد SOAR من عملية قرار ماركوف المدفوعة بالأحداث (Event-Driven Markov Decision Process) مما يمكّن النظام من الاستجابة الفورية لتغيرات البيئة. يتم استخدام ترانسفورمر الرسومات غير المتجانسة (Heterogeneous Graph Transformer) لتشفير حالة المخزون ودمج المعرفة في مراحل الإنتاج. علاوة على ذلك، يتم إدخال استراتيجية تشكيل المكافآت لمعالجة التغذية الراجعة النادرة في المهام الطويلة.

أظهرت التجارب الواسعة على مجموعات بيانات صناعية حقيقية ومصنعة، بالتعاون مع شركة Geekplus، أن SOAR نجح في تقليل الزمن الكلي للعمليات بنسبة 7.5% وزيادة سرعة إتمام الطلبات بنسبة 15.4% مع زمن استجابة دون الـ 100 مللي ثانية. كما أكد نشر النظام من المحاكاة إلى الواقع نجاحه العملي وتحقيقه لأداء متميز في البيئات الإنتاجية. يمكن العثور على الشيفرة المصدرية للإطار على GitHub عبر الرابط: https://github.com/200815147/SOAR.