في عالم يزخر بالتطورات التكنولوجية، يظهر Native3D كأول إطار عمل شامل لإنشاء المشاهد ثلاثية الأبعاد (3D) دون الاعتماد على تمثيلات ثنائية الأبعاد (2D) التقليدية. تعتمد معظم الأساليب الحالية على تحويل تمثيلات ثلاثية الأبعاد إلى المجال الثنائي الأبعاد للاستفادة من نماذج الانتشار المدربة مسبقًا، مما يؤدي إلى مشاكل في التكيف مع المجالات مثل تشوه الهياكل الهندسية وتدهور تفاصيل الأنسجة.

لمعالجة هذه القيود، تم تصميم تمثيل مشترك للهيكل والملمس يجمع بين نماذج الشكل (mesh) والملمس (texture) في تنسيق موحد. يستخدم هذا النظام مشفر مشهد يعتمد على نموذج Transformer للحفاظ على العلاقات المكانية والتناسق البصري بين الأجسام داخل المشاهد.

بالإضافة إلى ذلك، تم اقتراح خسارة محاذاة التمثيل ثلاثي الأبعاد (3D REPA Loss) التي تعتمد على آلية تعلم تباينية محسّنة. هذا يجعل من الممكن محاذاة التمثيلات الدلالية متعددة المستويات في الفضاء الكامن، مما يعزز بشكل كبير من دقة الهيكل والملمس.

أثبتت النتائج التجريبية أن Native3D يتفوق على الأساليب الحالية من حيث جودة التوليد ومرونة التحرير، مما يوفر حلًا جديدًا متميزًا لتحرير المشاهد ثلاثية الأبعاد.