في عالم اليوم الذي يتسم بتنوع الشبكات واختلاف أساليب التشغيل، تبرز تقنية التوجيه المتعدد المتداخل (Overlay Multicast) كحل فعال، متفوقة على التوجيه المتعدد المعتمد على بروتوكول الإنترنت (IP multicast) في توافقها وسهولة تطبيقها عبر الشبكات المختلفة.

ومع ذلك، كان هناك تحدي حقيقي في قدرة الأنظمة التقليدية على التكيف مع حركة المرور الديناميكية، وذلك بسبب عدم قدرتها على استشعار حالة الموارد الفيزيائية. بالإضافة إلى ذلك، كانت التقنيات الحالية للتعلم المعزز تواجه صعوبة في تفكيك طبيعة الأهداف المتعددة المرتبطة بالتوجيه المتعدد، مما أسفر عن تعقيد عالٍ، بطء في عملية التوافق، وعدم استقرار.

لتحقيق قفزة نوعية في هذا المجال، نُقدّم لكم طريقة MA-DHRL-OM، وهي منهجية جديدة تعتمد على التعلم المعزز العميق المتعدد الوكلاء (multi-agent deep hierarchical reinforcement learning). تعتمد هذه الطريقة على رؤية الشبكة العالمية (SDN) لبناء نموذج مدرك لحركة المرور، ما يساهم في تحسين تخطيط المسارات لتوجيه البيانات.

يتيح هذا الابتكار تفكيك عملية بناء شجرة التوجيه إلى مرحلتين عبر وكلاء هرميين، مما يقلل من أبعاد الفضاء العمل ويزيد من استقرار عملية التدريب. بذلك، تسهم التعاون بين الوكلاء المتعددين في تحقيق توازن بين الأهداف المتعددة مما يعزز من قابلية التوسع والقدرة على التكيف.

تشير التجارب العملية إلى أن MA-DHRL-OM تتفوق على الطرق السابقة في زمن الاستجابة، استخدام عرض النطاق الترددي، وانخفاض نسبة فقد الحزم، مما يُظهر استقرارًا أكبر وفي نفس الوقت مرونة أعلى في التوجيه.