تتطلب القيادة الذاتية الشاملة (E2E-AD) معالجة فعالة للبيانات الحسية متعددة الزوايا بالإضافة إلى التعامل بمرونة مع السيناريوهات المعقدة. هذا يبرز بشكل خاص عند الحاجة إلى تنفيذ مناورات نادرة مثل الانعطافات الحادة. في السنوات الأخيرة، حققت بنية مزيج الخبراء (Mixture-of-Experts - MoE) نجاحًا كبيرًا، وخاصة في نماذج اللغات الضخمة (Large Language Models - LLMs)، حيث ساهمت في تحسين القدرة على التوسع عبر تخصيص المعلمات.

اليوم، نقدم لكم DriveMoE، إطارًا مبتكرًا يعتمد على تقنية MoE للقيادة الذاتية. يتضمن DriveMoE نموذجين متخصصين: أحدهما للرؤية وآخر للإجراءات. يعتمد DriveMoE على نموذجنا الأساسي Drive-π0 من مجال الذكاء الاصطناعي المدمج.

ما يميز DriveMoE هو دمج رويتر الذكاء الاصطناعي لاختيار الكاميرات ذات الصلة وفقًا لسياق القيادة، مما يعكس طريقة تفكير السائقين البشريين في التواصل مع المؤشرات البصرية الحيوية. كما قمنا بإضافة Action MoE من خلال تدريب رويتر آخر لتنشيط وحدات الخبراء المتخصصة في سلوكيات القيادة المختلفة.

ومن خلال هذه التخصصات السلوكية الصريحة، يتمكن DriveMoE من التعامل مع مجموعة متنوعة من السيناريوهات دون التأثر بمشكلة متوسط الأوضاع التي تعاني منها النماذج التقليدية. في تجارب التقييم المغلقة Bench2Drive، حقق DriveMoE أداءً رائدًا في المجال (SOTA)، مما يدل على فعاليته في دمج MoE للرؤية والإجراءات في مهام القيادة الذاتية.

نحن نتطلع إلى مشاركة الشيفرة والنماذج الخاصة بـ DriveMoE وDrive-π0 قريباً.