في عالم الذكاء الاصطناعي (AI)، تظل المهام المتمثلة في تجارب واقعية طويلة الأمد واحدة من أكبر التحديات. حيث تعتمد الطرق الحالية في التعلم على المكافآت المصممة يدويًا أو على عروض تعليمية ذات تصنيف محدد، وهو ما لا يتناسب مع ضرورة تحسين التعلم بشكل مستدام. هنا يدخل نظام ASH، الذي يعد ثورة في كيفية تعلم الأنظمة الذكية من الفيديوهات المتاحة على شبكة الإنترنت.
يتمتع ASH بقدرة فريدة على التعلم من مقاطع الفيديو غير المصنفة والمليئة بالضجيج، دون الحاجة إلى توجيه مكافآت أو الاعتماد على تصنيفات الخبراء. يعمل النظام وفق حلقة تحسين ذاتي؛ فعندما يواجه صعوبة، يقوم ASH بتطوير نموذج الديناميكا العكسية (Inverse Dynamics Model) مستندًا إلى مساراته الخاصة، ويستخدم النموذج لاستخراج إشراف من مقاطع الفيديو ذات الصلة.
استخدم ASH التعلم غير الخاضع للإشراف لتحديد اللحظات الحاسمة من مقاطع الفيديو على نطاق واسع، ويحتفظ بها كذاكرة طويلة الأمد، مما يمكنه من التعامل مع مشكلات طويلة الأجل بشكل أكثر فعالية.
أجرينا تقييمًا لنظام ASH في بيئتين مكملتين تتطلبان تخطيطًا يستمر لعدة ساعات: لعبة Pokémon Emerald، وهي لعبة RPG تعتمد على الأدوار، ولعبة The Legend of Zelda: The Minish Cap، وهي لعبة مغامرة تعتمد على الحركة في الوقت الفعلي. وكما أظهر التقييم، كانت نتائج ASH مثيرة للإعجاب، حيث حقق متوسط 11.2 من 12 علامة في Pokémon Emerald و9.9 من 12 في Legend of Zelda، في حين توقفت أقوى النماذج الافتراضية عند متوسط 6.5 و6.0 من 12 علامة على التوالي.
من خلال هذا البحث، يثبت ASH أن الوكلاء الذين يتعلمون بشكل ذاتي يمثلون وصفة قابلة للتطوير لتعلم المهام المعقدة على المدى الطويل، مما يدفع حدود ما يمكن أن يحققه الذكاء الاصطناعي.
ASH: نظام ذكاء صناعي يتعلم ذاتياً من تجارب الفيديو
أطلق الباحثون نظام ASH الذي ي revolutionizes كيفية تعلم الذكاء الاصطناعي من الفيديوهات عبر الإنترنت، محققاً إنجازات بارزة في ألعاب استراتيجية معقدة. يستند النظام إلى تحسين ذاتي يمكنه التعامل مع تحديات التعلم على المدى الطويل بشكل أكثر فعالية من الأساليب الحالية.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
