في عالم الذكاء الاصطناعي، يمثل تصميم البيئات المشتركة بين الوكلاء (Agent-Environment Co-Design) واحداً من أهم الاتجاهات التي تسعى لتحسين أداء الأنظمة متعددة الوكلاء. هذه المقاربة تهدف إلى تحسين سياسات الوكلاء وتكوينات البيئة معًا، الأمر الذي يعد ثورة في كيفية نشر الأنظمة المتعددة الوكلاء في مجالات متنوعة تشمل إدارة المخازن وإدارة مزارع الرياح.

ومع ذلك، كانت الطرق الحالية تواجه صعوبة في التوسع، حيث تنهار تحت ضغط التصميم البيئي المرتفع الأبعاد وتعاني من نقص الكفاءة في العينات عند التعامل مع الأهداف المتحركة.

ولمعالجة هذه التحديات، تم تطوير تقنية جديدة تدعى تصميم التآزر بالانسياب (Diffusion Co-Design أو DiCoDe)، وهي نظام جديد يهدف إلى تحقيق توسيع عملي وفعال في العينات. يعتمد DiCoDe على ابتكارات رئيسية.

أولاً، تم إدخال تقنية الإرشاد العالمي الموجه (Projected Universal Guidance أو PUG)، والتي تمكن DiCoDe من استكشاف توزيعات بيئات تعزز المكافآت مع الالتزام بقيود صعبة مثل الفصل المكاني بين العقبات.

ثانيًا، تم تطوير آلية تقطير الناقد (Critic Distillation) لمشاركة المعرفة المستخلصة من نموذج التعلم المعزز، مما يضمن تكيف نموذج الانسياب الموجه مع سياسات الوكلاء المتطورة من خلال إشارات تعلم كثيفة ومحدثة.

تجري هذه التطورات لزيادة جودة أزواج البيئة-سياسة، حيث أظهرت اختبارات على معايير صعبة لتصميم بيئات متعددة الوكلاء، مثل أتمتة المخازن والتخطيط لمسارات متعددة الوكلاء. حقق هذا النظام تفوقًا ملحوظًا على الأساليب الحالية، حيث حصل على مكافآت أعلى بنسبة 39٪ في بيئة المخازن وقام بتقليل عدد عينات المحاكاة بنسبة 66٪.

تؤكد هذه الإنجازات أن DiCoDe يمثل معيارًا جديدًا في تصميم البيئة المشتركة بين الوكلاء، مما يمهد الطريق لتحقيق فوائد عملية في مجالات العالم الحقيقي.