في عالم البيولوجيا التجريبية والحسابية، يمثل تصميم جزيئات RNA التي تتفاعل مع بروتينات معينة تحدياً كبيراً. على الرغم من التقدم الملحوظ في نماذج اللغة الطبيعية (Natural Language Models) وتصميم البروتينات القائمة على التعلم العميق، لا زال هناك مجال واسع لتحسين احتمالات التفاعل الناجح وموثوقية التسلسلات الناتجة.

في هذا السياق، تم عرض إطار عمل مبتكر في دراسة جديدة، حيث تم تقديم نموذج يحمل اسم Moirain. هذا النموذج يهدف إلى تحسين عملية توليد تسلسلات RNA الخالية من الشروط (Zero-Shot Conditional RNA Generation)، من خلال وضعها في إطار مشكلة توافق متعددة المراحل.

تبدأ عملية Moirain من التدريب المسبق على مجموعات بيانات RNA الكبيرة والمتنوعة، مما يساعد في التقاط القواعد الأساسية لجدوى التسلسل. ولتحقيق توليد محدد الأهداف، يتبنى النموذج بنية معمارية متعددة الوسائط تقوم بشروط هندسة RNA على ميزات الهيكل والبنية التتابعية للبروتينات.

وبالإضافة إلى ذلك، يتم استخدام تقنيات تحسين التفضيل المباشر (Direct Preference Optimization - DPO) لمزيد من تحسين النموذج باستخدام بيانات التفاعل الاصطناعية. واستناداً إلى قدرة DPO الفريدة للتنقل في المساحات غير المتوافقة، يمكن تحسين الكفاءة الوظيفية دون فقدان التوزيع الطبيعي المتعلم.

التقييم المكثف لسلسلة Moirain (مكونات Moirain-Base، Moirain-Multi، وMoirain-DPO) يبين أن إطار العمل هذا ينتج بانتظام تسلسلات RNA جديدة، متنوعة، وذات جدوى بيولوجية مع تفاوت قوي في قدرتها على الارتباط مقارنة بالمعايير الحالية.

يمكن اعتبار هذا العمل بادرة جديدة نحو تحسين التصميم البيولوجي ودعم الإبداعات المستقبلية في مجالات البيولوجيا الاصطناعية.