في عالم الذكاء الاصطناعي، يعتبر [التعلم المعزز](/tag/[التعلم](/tag/التعلم)-المعزز) متعدد [الوكلاء](/tag/الوكلاء) (Multi-Agent [Reinforcement Learning](/tag/reinforcement-learning)) من المجالات الحيوية التي تتطلب تعاونًا مثمرًا بين عدة [وكلاء](/tag/وكلاء). إلا أن [النماذج](/tag/النماذج) التقليدية في هذا المجال تعاني من نقص في [دقة](/tag/دقة) تحديد [العلاقات](/tag/العلاقات) بين الوكلاء، مما يؤثر على [الأداء العام](/tag/[الأداء](/tag/الأداء)-العام). لذا، قدم [باحثون](/tag/باحثون) نموذجًا جديدًا يُعرف باسم [الرسوم البيانية](/tag/الرسوم-البيانية) التنسيقية ذات [المعلومات](/tag/المعلومات) المتنوعة (Heterogeneous Information-Bottleneck Coordination Graphs - HIBCG).
يتميز [نموذج](/tag/نموذج) HIBCG بقدرته على [تعلم](/tag/تعلم) [رسم بياني](/tag/رسم-بياني) متنوع يراعي المجموعة، حيث يُبرهن هذا النموذج على [اتصالات](/tag/اتصالات) [العلاقات](/tag/العلاقات) الوكيلة ويحدد ما إذا كان ينبغي وجود حواف (edges) معينة، بالإضافة إلى [التحكم](/tag/التحكم) في سعة الرسائل التي يمكن لكل علاقة تحملها.
يعمل HIBCG [عبر](/tag/عبر) [أداة](/tag/أداة) جديدة تُسمى "محدد [معلومات](/tag/معلومات) [الرسم البياني](/tag/الرسم-البياني)" (Graph Information Bottleneck - GIB)، حيث يستفيد من [معايير](/tag/معايير) مغلقة لتحديد الحواف المناسبة وكثافة التوصيل لكل مجموعة. هذا يتيح له [التحكم](/tag/التحكم) في عرض نطاق الميزات لكل [وكيل](/tag/وكيل) في النظام، مما يساعد في ضغط الرسائل لتحتفظ فقط بالمحتوى ذي الصلة بالمهام.
بفضل هذه التقنيات، يحقق النموذج تحسنًا ملحوظًا في [كفاءة](/tag/كفاءة) التعلم، حيث يثبت الباحثون أن هذا الأسلوب يضيق الحدود الخاصة بالتعلم الهيكلي، مما يوفر تحكمًا دقيقًا في كل علاقة [وكيل](/tag/وكيل) ويدعم [تخصيص الموارد](/tag/[تخصيص](/tag/تخصيص)-الموارد) بشكل يضمن الاستفادة القصوى لكل [وكلاء](/tag/وكلاء) المجموعة. مع HIBCG، ينتقل [التعلم المعزز](/tag/[التعلم](/tag/التعلم)-المعزز) إلى آفاق جديدة!
ما رأيكم في هذه التطورات الحديثة في مجال [الذكاء الاصطناعي](/tag/الذكاء-الاصطناعي)؟ شاركونا آراءكم في [التعليقات](/tag/التعليقات)!
ثورة في التعلم المعزز: الرسوم البيانية التنسيقية ذات المعلومات المتنوعة!
تقدم الدراسة الجديدة نموذجًا مبتكرًا في التعلم المعزز متعدد الوكلاء يتخطى القيود الحالية في الرسوم البيانية التنسيقية. هذا النموذج يتميز بتحديد أفضل للعلاقات بين الوكلاء وقدرات التواصل.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
