في عالم الذكاء الاصطناعي، يحتاج الروبوت البشري إلى تحقيق توافق حركي يعكس تعابير الكلام ويكون قابلاً للتنفيذ ضمن قيود الجسد الآلي. في الوقت الحالي، تركز تقنيات توليد الحركة على نماذج الجسم البشري، مثل (SMPL-X)، ومن ثم يتم إعادة توجيه (retargeting) هذه الحركات إلى الروبوتات.

تسلط الأبحاث الجديدة الضوء على فجوة جوهرية في هذا النهج، حيث تتسبب الفجوة بين أنماط الحركة البشرية وقيود الجسد الآلي في إحداث تناقض أثناء نقل الحركة وتنفيذها. وبينما يمكن أن تحافظ تقنيات إعادة التوجيه على المعاني العامة للحركة، إلا أنها تحد من تنوع الحركة وتضعف توافق الإيقاع الحركي، مما يؤثر سلباً على قدرة الروبوتات في التعبير.

لتجاوز هذه التحديات، يقدم الباحثون تقنية جديدة تُدعى (IK-EER) التي تجمع بين الجدوى الحركية والتوافق الزمني بين الحركة والكلام. وقامت الدراسة بتطوير إطار توليد حركة الكلام الهدّاف، المعروف باسم (PhysDrift)، والذي يتنبأ مباشرةً بمسارات مفاصل الروبوت القابلة للتنفيذ من الكلام، من دون الاعتماد على تمثيلات الجسم البشري.

ما يميز (PhysDrift) هو الحفاظ على توافق الجسد طوال عملية التدريب والاستنتاج، مع إدخال تنظيمات فيزيائية لتحسين ديناميكيات حركة الروبوت. أظهرت التجارب المكثفة ونشر التقنيات في العالم الحقيقي أن هذا الإطار новый يعزز من توافق الحركة والكلام، والواقعية الجسدية، وسلاسة الحركة، وكفاءة الاستنتاج، وقدرة التفاعل الفوري.

بهذا، فإن (PhysDrift) يمثل خطوة عالية نحو تحقيق تفاعل طبيعي وواقعي بين الإنسان والروبوتات الذكية، مانحًا إياها القدرة على فهم وتوقع الحركات المرتبطة بالكلام بشكل مثالي.