تزداد أهمية الأجهزة القابلة للارتداء في مراقبة الصحة بفضل قدرتها على جمع بيانات متعددة الأنماط بشكل مستمر. ومع ذلك، تواجه هذه التقنية تحديات كبيرة جراء نقص البيانات المعلّمة ووجود عجز في بعض الإشارات. رغم أن التدريب الذاتي الواسع النطاق (Large-scale self-supervised pretraining) يقلل من اعتمادنا على التسميات، فإن معظم الأساليب الحالية تفترض توفر جميع الأنماط بشكل كامل.

الإطارات التقليدية التي تتعامل مع نقص الأنماط غالبًا ما تقوم بإعادة بناء الإشارات المفقودة بالكامل، مما قد يؤدي إلى ظهور تفاصيل غير صحيحة قد تؤثر سلبًا على دقة النتائج. هنا يأتي دور VCR، وهو إطار يعتمد على التعلم الذاتي (Self-supervised framework) يتميز بقدرته على استخراج تمثيلات صحيحة وقوية بالرغم من نقص الأنماط.

يستخدم VCR مكونًا فريدًا يُسمى "المحوّل العمودي" (Orthogonal tokenizer) لضمان تفكيك صارم يمنع تداخل الأنماط. من خلال تصحيح الهياكل الكامنة (Latent manifolds) وتطبيق إسقاط هندسي (Geometric projection)، يحقق VCR فصلاً بين المعاني المشتركة وبقايا الخصائص المحددة لكل نمط.

هذا التصميم يعزز الحفاظ على المعلومات الكاملة ويشكل أساسًا قويًا للتعلم الفعال في ظل نقص الأنماط. يتم معالجة الرموز الناتجة بواسطة هيكل مختلط من الخبراء الواعيين بالنقص (Missing-aware mixture-of-experts backbone)، الذي يتكيف مع أنماط توافر الأنماط المختلفة. من خلال تقييد الهدف على إعادة بناء المكونات المشتركة فقط، يتمكن VCR من تقليل حدوث تفاصيل غير قابلة للاستخلاص.

أظهرت التجارب أن VCR يحسن الأداء والثبات في مختلف مهام مراقبة الصحة، سواءً في الظروف الكاملة أو في حالتي نقص نمط واحد أو عدة أنماط، مقارنةً بأسس قوية للتعلم المتعزز والتعلم الذاتي.