في عالم الذكاء الاصطناعي، تزداد الحاجة إلى [تطوير](/tag/تطوير) [وكلاء](/tag/وكلاء) يستطيعون التعامل مع مشاكل [التخطيط](/tag/التخطيط) المعقدة على المدى الطويل. لذلك، تم طرح مقترح [جديد](/tag/جديد) يسعى لحل هذه التحديات من خلال [تعلم](/tag/تعلم) [السياسات](/tag/السياسات) متعددة المستويات. يعتمد هذا النظام على دمج [التعلم](/tag/التعلم) الاقتدائي ([Imitation Learning](/tag/imitation-learning)) من خلال عرض المهام المختلفة مع الرموز المجردة (Symbolic Abstractions) التي تُثبت فعاليتها في التعامل مع [التخطيط](/tag/التخطيط) الطويل الأمد.
يعتمد النظام الجديد، المعروف باسم BISON، على فكرة استخدام [سياسات](/tag/سياسات) بيلوف (Bilevel Policies) المكونة من [سياسة](/tag/سياسة) [عصبية](/tag/عصبية) تتعلم من الأمثلة المباشرة، إلى جانب [سياسة](/tag/سياسة) رمزية ترتكز على [تجريدات](/tag/تجريدات) تلك الأمثلة. هذه الاستراتيجية توفر وسيلة فعالة وسلسة لحل مشكلات [التخطيط](/tag/التخطيط) المعقدة بموارد أقل.
أظهرت [التجارب](/tag/التجارب) على [معايير](/tag/معايير) MetaWorld الممتدة أن BISON يتمتع بقدرة عالية على [تعميم](/tag/تعميم) [التخطيط](/tag/التخطيط) [عبر](/tag/عبر) آفاق زمنية طويلة ويتفوق في [حل المشكلات](/tag/حل-المشكلات) التي تحتوي على [عدد](/tag/عدد) أكبر من الكائنات بالمقارنة مع الطرق السابقة مثل [VLA](/tag/vla) وطرق [التعلم](/tag/التعلم) الشامل. الغريب أن النظام الجديد يمكنه [حل المشكلات](/tag/حل-المشكلات) المعقدة مع 10,000 كائن ذي صلة في أقل من دقيقة، مما يدل على كفاءته الزمنية والذاكرية.
يسعى هذا [البحث](/tag/البحث) إلى دفع حدود ما يمكن تحقيقه في مجال الذكاء الاصطناعي، ويشكل بداية جديدة لتطبيقات أكثر تطوراً تعتمد على [التخطيط](/tag/التخطيط) المعقد. ما رأيكم في هذه التطورات؟ دعونا نتناقش.
استراتيجية مبتكرة: تعلم سياسات متعددة المستويات للذكاء الاصطناعي لحل مشكلات التخطيط المعقدة
يمثل مقترح تعلم السياسات متعددة المستويات خطوة مهمة نحو تعزيز قدرات الذكاء الاصطناعي في مجالات التخطيط المعقد. يجمع هذا النظام بين التعلم الاقتدائي والرموز المجردة لتحقيق نتائج مذهلة في أوقات قياسية.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
