تعتبر القدرة على تطوير وحدات تحكم قادرة على إكمال مجموعة واسعة من المهام بطريقة طبيعية وواقعية من أبرز التحديات في تطبيقات الرسوم المتحركة المستندة إلى الفيزياء. في هذا البحث، نقدم وحدات التحكم المولدة (Generative Pretrained Controllers - GPC) التي تستفيد من عملية التجزئة ونمذجة الرمز التالي لإنشاء وحدات تحكم عامة وقابلة لإعادة الاستخدام من مجموعات بيانات الحركات واسعة النطاق.

يعتمد إطار العمل المقترح على التعلم المعزز من البداية إلى النهاية، حيث يتم تحسين "معجم الحركات" (motion vocabulary) من خلال نمذجة كودات نقطة كمومية محددة (Finite Scalar Quantization - FSQ) مع سياسة تحكم مطابقة يمكنها تحويل الرموز المنفصلة إلى تحكمات قائمة على الفيزياء.

بعد تعلم "كتاب الرموز"، يتم نمذجة الهيكل الأساسي لهذا المفردات الكبيرة عبر تدريب نموذج أوتوريجيسي على غرار GPT. مما ينتج عنه وحدة تحكم مولّدة قوية قادرة على إنشاء تحكمات لشخصيات محاكية للفيزياء من خلال تنفيذ توقع الرمز التالي. وبمجرد تدريب وحدة التحكم المولّدة، نقترح مجموعة من تقنيات التكيف لنقلها إلى مهام جديدة.

يعزز الإطار المقترح بشكل كبير من عملية التدريب مقارنة بالطرق السابقة المتمثلة في التجزئة، ويتحقق من معدل نجاح يبلغ 99.98% في إعادة إنتاج مجموعة شاسعة من مقتطفات الحركة. تظهر وحدة التحكم المولّدة مجموعة متنوعة من السلوكيات الطبيعية الناشئة مثل السلوكيات المستجيبة للتغيرات وسلوكيات الاستعادة بعد السقوط، مما ينتج عنه وحدات تحكم عامة قوية لمجموعة متنوعة من التطبيقات المستقبلية.