في عالم الذكاء الاصطناعي، تزداد الحاجة إلى [تطوير](/tag/تطوير) [وكلاء](/tag/وكلاء) يستطيعون التعامل مع مشاكل [التخطيط](/tag/التخطيط) المعقدة على المدى الطويل. لذلك، تم طرح مقترح [جديد](/tag/جديد) يسعى لحل هذه التحديات من خلال [تعلم](/tag/تعلم) [السياسات](/tag/السياسات) متعددة المستويات. يعتمد هذا النظام على دمج [التعلم](/tag/التعلم) الاقتدائي ([Imitation Learning](/tag/imitation-learning)) من خلال عرض المهام المختلفة مع الرموز المجردة (Symbolic Abstractions) التي تُثبت فعاليتها في التعامل مع [التخطيط](/tag/التخطيط) الطويل الأمد.

يعتمد النظام الجديد، المعروف باسم BISON، على فكرة استخدام [سياسات](/tag/سياسات) بيلوف (Bilevel Policies) المكونة من [سياسة](/tag/سياسة) [عصبية](/tag/عصبية) تتعلم من الأمثلة المباشرة، إلى جانب [سياسة](/tag/سياسة) رمزية ترتكز على [تجريدات](/tag/تجريدات) تلك الأمثلة. هذه الاستراتيجية توفر وسيلة فعالة وسلسة لحل مشكلات [التخطيط](/tag/التخطيط) المعقدة بموارد أقل.

أظهرت [التجارب](/tag/التجارب) على [معايير](/tag/معايير) MetaWorld الممتدة أن BISON يتمتع بقدرة عالية على [تعميم](/tag/تعميم) [التخطيط](/tag/التخطيط) [عبر](/tag/عبر) آفاق زمنية طويلة ويتفوق في [حل المشكلات](/tag/حل-المشكلات) التي تحتوي على [عدد](/tag/عدد) أكبر من الكائنات بالمقارنة مع الطرق السابقة مثل [VLA](/tag/vla) وطرق [التعلم](/tag/التعلم) الشامل. الغريب أن النظام الجديد يمكنه [حل المشكلات](/tag/حل-المشكلات) المعقدة مع 10,000 كائن ذي صلة في أقل من دقيقة، مما يدل على كفاءته الزمنية والذاكرية.

يسعى هذا [البحث](/tag/البحث) إلى دفع حدود ما يمكن تحقيقه في مجال الذكاء الاصطناعي، ويشكل بداية جديدة لتطبيقات أكثر تطوراً تعتمد على [التخطيط](/tag/التخطيط) المعقد. ما رأيكم في هذه التطورات؟ دعونا نتناقش.