تسعى التكنولوجيا الحديثة دائماً إلى تحسين الأداء في مجموعة متنوعة من المهام، ولقد أظهرت المهام الروبوتية تنوعًا كبيرًا في احتياجات الذاكرة، من المهام التي تعتمد على المعلومات الحالية فقط (Markovian) إلى المهام الأكثر تعقيدًا التي تعتمد على تاريخ المعلومات السابقة (non-Markovian). للأسف، يُمكن أن يؤدي توسيع تواريخ المراقبة في سياسة الرؤية والحركة إلى تراجع كبير في الأداء بسبب التغير في التوزيع (distribution shift) وانتقال التركيز (overfitting).
لمواجهة هذه التحديات، تم اقتراح استراتيجية الذاكرة المُقيدة (Gated Memory Policy - GMP)، وهي سياسة لرؤية وحركة تساعد الروبوتات على تعلم متى وأيّ ذاكرة يجب أن تتذكرها. تعتمد هذه الاستراتيجية على آلية بوابة ذاكرة مُتعلمة (learned memory gate) التي تقوم بتنشيط سياق الذاكرة فقط عند الحاجة، مما يعزز من قدرة الروبوتات على الاستجابة بفعالية.
علاوة على ذلك، تُدخل استراتيجية GMP وحدة اهتمام عبرية خفيفة الوزن (lightweight cross-attention module) تستفيد من الذاكرة الكامنة لبناء تمثيلات فعالة. ولزيادة المتانة، يتم إضافة ضوضاء انتشارية (diffusion noise) إلى الإجراءات التاريخية لتقليل الحساسية تجاه المعلومات غير الدقيقة خلال عملية التدريب والاستدلال.
على معيارنا غير ماركوفيان (non-Markovian benchmark) المعروف باسم MemMimic، تحقق استراتيجية GMP زيادة بنسبة 30.1% في معدل النجاح مقارنة بأساليب الذاكرة طويلة الأمد، مع الحفاظ على أداء تنافسي في المهام ماركوفيان من خلال RoboMimic.
لمحبي التكنولوجيا، الكود والبيانات وتعليمات النشر في البيئات الحقيقية متاحة على موقع المشروع https://gated-memory-policy.github.io/.
ما هي آرائكم حول استخدام هذه الاستراتيجية الجديدة في تحسين أداء الروبوتات؟ شاركونا أفكاركم في التعليقات!
استراتيجية الذاكرة المُقيدة: ثورة في معالجة المهام الروبوتية المعقدة!
تقدم استراتيجية الذاكرة المُقيدة (GMP) نهجًا مبتكرًا في معالجة المهام الروبوتية، حيث تلعب الذاكرة دورًا حيويًا في تحسين الأداء. هذه التقنية الجديدة تحقق فوائد كبيرة في المهام التي تعتمد على المعلومات التاريخية.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
