تواجه نماذج اللغة الكبيرة (Large Language Models) تحدياً كبيراً في توقع نتائج التجارب السريرية المستقبلية. ووفقاً للدراسات السابقة، أظهرت النماذج التقليدية مثل الغابات العشوائية (Random Forests) والانحدار اللوجستي (Logistic Regression) والنماذج التجارية القوية أداءً محدودًا في هذا المجال.

لكن مع ظهور إطار العمل الجديد "ديب إيميجن" (DeepImagine)، نتوقع تحولاً جذرياً في كيفية تعليم هذه النماذج التفكير في المسائل الطبية الحيوية. يعتمد هذا الإطار على فكرة تحليل الآليات السببية المخفية للتجارب السريرية من خلال تدريب النماذج على تخيل كيفية تغير نتائج التجارب بناءً على تغييرات محكومة في ظروف التجربة، مثل جرعة الدواء والمعايير المعيارية والتوزيع الجغرافي وغيرها.

لتحقيق هذا الهدف، أنشأنا أزواجاً من التصورات المضادة (Counterfactuals) من تجارب سريرية حقيقية تم الإبلاغ عن نتائجها. وفي حالات توفر إشراف صارم للتصورات المضادة، مثل قياسات النتائج المقارنة أو التجارب الحلقية ضمن نفس التجربة، نقوم بتدريب النماذج باستخدام تحسينات دقيقة بإشراف. بينما في الحالات التي يمكن استرجاع فيها فقط أزواج تقريبية، نستخدم التعلم المعزز (Reinforcement Learning) مع مكافآت قابلة للتحقق بناءً على صحة النتائج السفلية.

علاوةً على ذلك، نقوم بتوجيه التدريب بواسطة مسارات تفسيرية صنعية توفر تفسيرات سببية معقولة للتغيرات المحلية في التصورات المضادة. من خلال هذه الآليات، تم تدريب نماذج لغوية تحتوي على أقل من 10 مليار معلمة، بما في ذلك Qwen3.5-9B، وتم تقييم أدائها في توقع نتائج التجارب السريرية.

نهدف من خلال ديب إيميجن إلى تحسين الأداء بشكل متسق مقارنةً بالنماذج اللغوية الغير معدلة والأساليب التقليدية. كما نهدف إلى تقديم إشارات قابلة للتفسير حول كيفية تمثيل النماذج للآليات بمستوى التجربة، مما يشير إلى مسار عملي نحو نماذج لغوية طبية حيوية أكثر آلية وفائدة علمية.