في عالم التعاون متعدد الوكلاء، خاصةً بين الإنسان والذكاء الاصطناعي، يُعتبر التكيف مع الشركاء الجدد الذين يتمتعون بسلوكيات متنوعة ومتغيرة تحديًا جوهريًا. وقد أظهرت الأساليب التقليدية المستخدمة في التعلم العميق المعزز (Deep Hierarchical Reinforcement Learning - DHRL) تركيزًا كبيرًا على المكافآت المركزية (agent-centric rewards) دون الأخذ بعين الاعتبار تصرفات الشركاء، مما يؤدي إلى تعلم مختصر غير فعال.
هذا التعلم المختصر يعتمد على المعلومات السطحية بدلاً من التكيف مع الديناميكيات التي يتحلى بها الشركاء. إن هذه القيود تقلل من قدرة الوكلاء على التكيف والتنسيق بشكل فعال مع شركاء جدد. هنا يأتي دور الابتكار الجديد الذي يقدم مفهوم "اكتشاف المهارات المعتمدة على الشريك" (Partner-Aware Skill Discovery - PASD)، وهو إطار عمل تطبيقي يتعلم المهارات بناءً على سلوك الشركاء.
تقدم PASD نظامًا مكافئًا داخليًا تباينيًا لالتقاط الأنماط الناشئة من التفاعلات بين الشركاء، مما يضمن توافق تمثيلات المهارات عبر الشركاء المتشابهين مع الحفاظ على التمييز عبر استراتيجيات متنوعة. من خلال تنظيم فضاء المهارات اعتمادًا على تفاعلات الشركاء، يقلل هذا المنهج من التعلم المختصر ويعزز الاتساق السلوكي، مما يمكّن من تنسيق قوي وتكيف فعال.
لقد تم تقييم PASD بشكل موسع في معايير Overcooked-AI مع مجموعة متنوعة من الشركاء الذين يتميزون بمستويات مهارة وأسلوب لعب متفاوت. كذلك تم اختبار المنهج باستخدام نماذج بشرية تم تدريبها استنادًا إلى مسارات لعب بشري بين لاعبين. وقد أثبت PASD تفوقه المستمر على الأساليب التقليدية القائمة على السكان والأساليب الهرمية، مما يدل على قدرته على تعلم المهارات بطريقة قابلة للنقل عبر مجموعة واسعة من سلوكيات الشركاء.
عند تحليل تمثيلات المهارات المتعلمة، يتضح أن PASD يتكيف بشكل فعال مع سلوكيات متنوعة للشركاء، مما يُظهر قوته في التعاون الإنساني-الذكاء الاصطناعي.
اكتشاف المهارات الذكية: ثورة جديدة في التعاون بين الإنسان والذكاء الاصطناعي
تقديم إطار عمل جديد يعزز التعاون بين الإنسان والذكاء الاصطناعي من خلال اكتشاف المهارات المعتمدة على سلوك الشركاء. هذه التقنية تعد بخطوة رائدة لتحسين التكيف والتنسيق بين الأنظمة الذكية.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
