في عالم تكنولوجيا الرعاية الصحية، تعتبر تقنية التصوير بالرنين المغناطيسي للقلب (Cine Cardiac Magnetic Resonance) المعيار الذهبي لتقييم وظائف القلب. ومع ذلك، يواجه مطورو نماذج البيانات المتقدمة تحديات عدة بسبب نقص مجموعات البيانات العامة. لمواجهة هذه المشكلة، طوّر فريق من الباحثين طريقة توليد جديدة تتيح توليد تسلسلات قلبية متناسقة من الناحية الزمنية ومتماثلة من الناحية التشريحية.

تقوم هذه الطريقة المبتكرة على نموذج نص إلى فيديو (Text-to-Video) يفصل بين الهيكل المكاني للقلب والحركة الزمنية. في البداية، يقوم نموذج تمييز تم ضبطه بدقة بتوليد إطار ابتدائي استنادًا إلى نص إكلينيكي، مما يتيح السيطرة على الميزات التشريحية. بعد ذلك، يعمل نموذج التدفق الكامن (Latent Flow Model)، المتعارف عليه وفقًا لمرحلة القلب، على توليد الحركة الكاملة للقلب، مما يضمن التناسق المكاني والسيطرة الزمنية.

النتائج التجريبية لهذا النموذج تشير إلى إنه قادر على إنتاج تسلسلات متنوعة من الناحية التشريحية والمرضية بدقة زمنية عالية، حيث حقق درجة فريدة (FID) تبلغ 31.68 لدقة الصور ودرجة CLIP بلغت 31.04 لمحاذاة النص مع الصور. هذه النتائج تعزز إمكانيات النموذج في إنتاج البيانات الطبية بدقة عالية عند الطلب، مما يوفر حلاً قابلًا للتوسع لمشكلة نقص البيانات في هذا المجال المهم.