تمثل القدرة على توقع الحركة من صورة واحدة تحديًا معقدًا في مجال الذكاء الاصطناعي، إلا أن فريقًا من الباحثين ابتكر نموذجًا فريدًا يتجاوز حدود النماذج التقليدية. يعتمد هذا النموذج على تقنية توليد المسارات (Trajectories) بشكل كثيف، مما يسمح له بالتنبؤ بكيفية حركة الأجسام في العالم الواقعي، دون الحاجة لمراقبة معايير أخرى مثل سرعة الأجسام أو القوى المؤثرة عليها.

لقد قام الباحثون بتطوير خوارزمية تلتزم بمعمارية مولدات الفيديو الحديثة، لكنها تستخرج المسارات الحركية بدلاً من البيكسلات. ومن خلال هذا النهج، يتمكن النموذج من التقاط الديناميات الواسعة للمشهد والاحتمالات المحيطة بالحركة، مما يؤدي إلى توقعات أكثر دقة وتنوعًا مقارنة بالنماذج السابقة.

أجرى الفريق تقييمات شاملة على بيانات محاكاة، وأظهروا فعالية نموذجهم في تطبيقات مختلفة، بما في ذلك مجال الروبوتات. كما حقق النموذج نتائج واعدة عند اختباره على مجموعات بيانات فيزيائية حقيقية، مما يدل على إمكانياته الكبيرة.

ومع ذلك، وعلى الرغم من أن مولدات الفيديو الحديثة تُعتبر نماذج عالمية، إلا أن الباحثين كشفوا أنها تواجه صعوبات في التنبؤ بالحركة من صورة واحدة، حتى في السيناريوهات الفيزيائية البسيطة مثل سقوط الكتل أو تفاعلات الأجسام الميكانيكية. تكمن المشكلة في أن توليد البيكسلات يتطلب موارد كبيرة، مما يؤثر سلبًا على قدرة النموذج على التنبؤ بدقة.

في الختام، يمثل هذا البحث خطوة هامة نحو فهم أفضل لكيفية اعتبار الحركة في أنظمة الذكاء الاصطناعي، ويفتح الأبواب لمزيد من الابتكارات في هذا المجال.