في عالم يتطور بسرعة، تتزايد الحاجة إلى نماذج قادرة على التعامل مع تعليمات لغوية معقدة، خاصة في مجال التحكم الجسدي للروبوتات. لكن، ماذا لو أخبرتك أن هناك طريقة جديدة تجعل هذه المهمة أكثر فعالية؟ هنا يأتي دور Key-Gram.
تقدم Key-Gram إطار عمل ذاكرة شرطي يوجه الجهود لفصل المعرفة المستمدة من اللغة عن الرؤية البصرية، مما يتيح للأنظمة التركيز على مهمتها الأساسية وهي التفكير البصري واستنتاج الأفعال بشكل أكثر كفاءة.
يتضمن النظام وحدة ذاكرة تهتم بتفكيك التعليمات إلى «مفاتيح» (key-grams) محددة للمهام، وتستخرج المعارف اللغوية الثابتة من خلال أسلوب بحث معين، مع إدخال النتائج المستخلصة في طبقات خفية مختارة بواسطة تصنيف يعتمد على السياق ودمج خفيف.
تتيح هذه الفكرة للنموذج أن يخصص طاقته الأساسية للتفكير المرئي واستنتاج الأفعال، في حين تُخزن المعرفة اللغوية القابلة لإعادة الاستخدام في ذاكرة خارجية قابلة للتوسع. تم اختبار Key-Gram على أنظمة مثل RoboTwin2.0 وLIBERO، حيث أظهرت نتائج تدعونا للتفاؤل، مع تحسينات ملحوظة في الأداء تصل إلى 29.5% على RoboTwin2.0 و35.8% على LIBERO-Plus.
تعد هذه النتائج دليلاً قوياً على أن ذاكرة اللغة الخارجية ليست فقط فعالة، بل يمكن أن تعزز من تحسين عملية الربط بين الأوامر اللغوية والعمليات الحركية في العالم الحقيقي. كل ذلك يعني أننا على مشارف فصل جديد في عالم الذكاء الاصطناعي والتحكم بالروبوتات والمزيد من الابتكارات المستقبلية التي يتجلى فيها الإبداع البشري.
Key-Gram: ثورة جديدة في التحكم بالجسم من خلال معرفتنا العالمية القابلة للتوسع!
تقدم Key-Gram نظام ذاكرة شرطي يفصل بين المعرفة اللغوية والرؤية البصرية، مما يعزز من كفاءة التحكم في الروبوتات. النتائج مثيرة، حيث تحقق تحسينات ملحوظة في المهام المعقدة.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
