يشهد مجال إدارة سلسلة الإمداد (Supply Chain Management) نقلة نوعية بفضل تطبيقات نماذج اللغات الضخمة (Large Language Models) التي أظهرت إمكانيات واعدة في التفكير المعقد واتخاذ القرار بناءً على أدوات. لكن، تبقى التحديات قائمة، خاصة في ما يتعلق بجميع جوانب سلسلة الإمداد التي تحتاج إلى تنسيق موثوق وممتد عبر عدة خطوات. لذلك، تم تطوير أداة SupChain-Bench، وما يميزها هو تقييمها العلمي لنماذج اللغات في سياقات حقيقية.

تعمل SupChain-Bench كنموذج موحد لتقييم أداء هذه النماذج فيما يتعلق بالمعرفة المتعلقة بسلسلة الإمداد، وتنسجم مع الإجراءات التشغيلية القياسية (Standard Operating Procedures - SOPs). خلال التجارب التي أجريناها، اكتشفنا وجود فجوات كبيرة في موثوقية التنفيذ بين النماذج، مما يسلط الضوء على الضرورة الملحة لتحسين الأداء.

بالإضافة إلى ذلك، قدمنا نموذج SupChain-ReAct، الذي يقوم بتوليف إجراءات قابلة للتنفيذ دون الاعتماد على SOPs، وحقق هذا النموذج أداءً قوياً ومستقراً في استدعاء الأدوات. هذه النتائج لا تقدم تصوراً واضحاً حول فعالية نماذج اللغات الضخمة فحسب، بل تسلط الضوء أيضاً على الإمكانيات الضخمة التي يجب استكشافها لتحسين وكالات سلسلة الإمداد المعتمدة على الذكاء الاصطناعي.

في النهاية، يحدد عملنا مرجعاً موثوقاً لدراسة التنسيق طويل الأمد في سياقات العمليات التجارية الحقيقية، ويدعو مجتمع الذكاء الاصطناعي إلى تعزيز البحث والتحسين بشكل مستمر. ما رأيكم في هذا التطور؟ شاركونا في التعليقات.