في عالم البيانات الضخمة الناتجة عن المحاكاة العلمية، تمثل مشكلات الضغط تحديًا كبيرًا. تعتمد تقنيات الضغط التقليدية على ضغط الفقد، مما يؤثر على دقة البيانات، بينما توفر أدوات الضغط المُتعلمة (Learned Compressors) نسب ضغط عالية مع دقة متوسطة. ولكن حتى مع هذه التقدمات، غالبًا ما لا تضمن خسائر إعادة الإعمار التجميعية دقة لكل كتلة من البيانات.

للتغلب على هذه القيود، ابتكرت مجموعة من الباحثين مفهوم "النماذج المتبقية" (Residual Modeling) التي تتطلب معالجة أكثر تعقيدًا للتباين الهيكلي بين البيانات الأصلية والنماذج المتبقية. يقترح العلماء طريقتين جديدتين للتعامل مع هذه البيانات: الأولى هي "LBRC"، وهي عملية حتمية لا تتطلب تدريبًا. تقوم هذه الطريقة بتكميم المتبقيات المُتعلمة بشكل تكييفي باستخدام تقنيات مثل "3D Lorenzo differencing" و"bit-plane coding".

أما الطريقة الثانية، فهي "NGLR"، التي تضيف مُتنبئًا عصبيًا يساعد في تخفيض اتساع المتبقيات، مما يحسن من دقة الضغط مع الحفاظ على عملية فك الشيفرة الحتمية.

عند الاختبار على بيانات هامة مثل E3SM وJHTDB وERA5، أظهرت هذه التقنيات النتائج المذهلة: حيث حققت LBRC زيادة نسب ضغط بنسبة 30-60% مقارنة بأساليب "Guaranteed Autoencoder"، بينما قدمت NGLR تحسينًا إضافيًا بنسبة 10-40% على LBRC، متفوقةً بذلك على الأنظمة الأخرى في ساحة دقة الضغط العالي.

تُظهر هذه النتائج أن التركيز على تمثيلات المتبقيات المُعدلة يمكن أن يحتفظ بميزة الضغط المُتعلم حتى عند تجاوز تصحيح المتبقيات للمعدلات المسيطرة.