أحدثت نماذج اللغات الكبيرة (Large Language Models - LLMs) ثورة في طريقة تفاعل الذكاء الاصطناعي مع البيئة من حوله، حيث نجحت في إظهار قدرات قوية في اتخاذ القرارات التفاعلية. ولكن، على الرغم من هذه النجاحات، لا تزال هناك قيود أساسية عندما يتعلق الأمر بالمهام الطويلة الأمد التي تتطلب تخطيطًا منظمًا وتنفيذًا موثوقًا.

يعتمد معظم النماذج الحالية على سياسات آلية أوتوريجيفية مسطحة، حيث يتم توليد التفكير على المستوى العالي والإجراءات على المستوى المنخفض ضمن سلسلة واحدة من الرموز. هذه الطريقة تؤدي إلى استكشاف غير فعّال وانتشار أخطاء جسيمة على مدى مسارات طويلة. وهنا يأتي دور HiMAC (التعلم الهرمي للصورة الكبيرة والصغيرة) لثورات جديدة.

يقدم HiMAC إطارًا هرمياً يُمكن الانتقال من خلاله إلى التخطيط طويل الأمد، حيث يقوم بتفكيك عملية اتخاذ القرار إلى التخطيط على المستوى الكلي (Macro) والتنفيذ على المستوى الدقيق (Micro). يتمثل المبدأ الأساسي في HiMAC في نموذج التفكير كعملية لإنشاء المخططات الهيكلية، يتبعها تنفيذ الأفعال المستندة إلى الأهداف.

لضمان كفاءة هذا الهيكل الهرمي، تُقدم تقنية جديدة تُعرف بـ"فلسفة تعزيز السياسات الهرمية"، التي توسع التعلم على أساس المجموعة للهيكلين الثنائي المستويات عن طريق تقدير المزايا النسبية الهرمية. كما يتم استخدام استراتيجية تدريب تطورية تكرارية تتناوب بين استكشاف المخطط وتكيف المنفذ، مما يساعد في تقليل عدم الاستقرار الموجود عادةً في التعلم الهرمي.

تم إجراء تجارب موسعة على بيئات مثل ALFWorld وWebShop وSokoban، حيث أظهرت HiMAC أداءً متفوقًا مقارنة بطرق التعزيز والتوجيه الحالية، محققة نتائج متطورة وكفاءة ملحوظة في العينة.

تؤكد نتائجنا أن إدخال هيكلية منظمة، بدلاً من زيادة حجم النموذج فقط، هو عامل رئيسي لتمكين الذكاء الوكيل قوي المدى. دعونا نتطلع إلى ما سيقدمه هذا الابتكار في مجال الذكاء الاصطناعي في المستقبل.