على الرغم من التقدم الكبير في تقنية تقدير وضعية الإنسان ثلاثية الأبعاد (3D Human Pose Estimation)، إلا أن معظم الطرق الحالية تعتمد بشكل رئيسي على معايرة دقيقة للكاميرات، مما يحد من تطبيقاتها في الواقع العملي. لكن، قام فريق بحثي بتقديم إطار عمل غير مقيد يحل هذه المشكلة من خلال دمج الشبكات العصبية العميقة (Deep Neural Networks)، العلاقات الجبرية (Algebraic Priors)، والديناميات الزمنية (Temporal Dynamics) لتقدير وضعيات الإنسان من زوايا متعددة دون الحاجة إلى المعايرة.
في البداية، قام الباحثون بتطوير طريقة تسمى "Triangulation with Transformer Regressor (TTR)"، والتي تعيد صياغة تقنية التثليث الكلاسيكية إلى عملية دمج تعتمد على البيانات تتجاوز الاعتماد على معلمات الكاميرا الواضحة. إضافةً إلى ذلك، قدموا "Gröbner basis Corrector (GC)"، وهي صيغة خسارة مبتكرة تُجبر النموذج على الالتزام بالعلاقات الجبرية الأساسية لنوع الزوايا المتعددة، مما يضمن توافق التنبؤات مع قوانين الهندسة الإسقاطية.
ختامًا، صمم الفريق "Temporal Equivariant Rectifier (TER)"، الذي يستفيد من خاصية تواءم الحركة البشرية لتعزيز التماسك الزمني والاتساق الهيكلي، مما يساعد في تقليل الغموض الذي ينشأ في البيئات غير المعايرة. أظهرت التقييمات الواسعة على المعايير القياسية أن هذا الإطار الجديد يحقق مستوىً جديداً من الأداء في تقدير وضعيات الإنسان من زوايا متعددة بدون معايرة. كما أنه يقلل بشكل ملحوظ الفجوة في الأداء بين الطرق الخالية من المعايرة والأساليب المعايرة بالكامل.
ثورة في تقدير وضعية الإنسان ثلاثي الأبعاد: الذكاء الاصطناعي يتجاوز القيود التقليدية!
ابتكر الباحثون إطار عمل جديد لتقدير وضعية الأشخاص ثلاثية الأبعاد دون الحاجة لمعايرة دقيقة للكاميرات. يعتمد هذا النظام على تقنيات متقدمة مثل الشبكات العصبية العميقة والعلاقات الجبرية لتحقيق دقة غير مسبوقة.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
