في عالم الطب الحديث، تُعتبر الأجسام المضادة (Antibody therapeutics) من أكثر الأدوية نجاحًا. ومع ذلك، لا يزال تصميم الأجسام المضادة وفق خصائص معينة يعد تحديًا كبيرًا للعلماء. لقد برزت نماذج لغات البروتين (Protein Language Models) كأدوات قوية لتصميم تسلسلات الأجسام المضادة، ولكن هناك عقبتان رئيسيتان تعوقان هذه الجهود: عجز النماذج عن نمذجة التنوع البيولوجي الفسيولوجي، وقيود الدعم لتوليد البيانات المشروطة من خلال التصنيفات.

نتناول هذا التحدي من خلال مساهمتين رئيسيتين. أولاً، نقدم طريقة جديدة تعتمد على تعديل تقنيات الانتشار التفاضلي (Discrete Diffusion) لتحسين أداء نمذجة اللغة على تسلسلات الأجسام المضادة، مما يسمح بتوليدها وفق أي تصنيف متاح. ثانياً، نقدم مفهوم جديد يُسمى "الانتشار الممتص للرسم الجيني" (Germline Absorbing Diffusion)، حيث تُستخدم تسلسلات الأجسام المضادة الجينية كحالة امتصاص، مما يساعد النموذج على التعلم من الرسم الجيني إلى التسلسل المرصود.

هذا التعديل البيولوجي يخفف من تحيز الرسوم الجينية، مما يتيح لنا زيادة دقة التنبؤ بالحموض غير الجينية من 26% إلى 46%، مما يقترب من الحد النظري الذي تحدده المتغيرات البيولوجية الحقيقية. كما نوضح استخدام نموذج الانتشار الممتص للرسم الجيني في توليد أوضاع مشروطة لتحسين صفات الأجسام المضادة، مثل زيادة الخصائص غير القطبية والتنبؤ بتشابه الارتباط. هذا الابتكار يُظهر أن النموذج الجديد يتفوق بشكل ملحوظ على استراتيجيات أخرى متداولة في السوق، مما يشير إلى مستقبل واعد في تصميم الأدوية.