في عالم يتزايد فيه الاعتماد على تقنيات تخليق الحمض النووي، وتأثيرها الواسع على المجالات الطبية والبحثية، تبرز ضرورة وجود وسائل آمنة وموثوقة لفحص المخاطر المرتبطة بهذه التقنيات. وقد كشفت دراسة حديثة عن تطوير نموذج جديد يُعرف باسم فحص مخاطر تخليق الحمض النووي المعتمد (CRC-Screen) والذي يعد خطوة ثورية في هذا الاتجاه.

يتوجه هذا الفحص للحد من الأخطاء الكاذبة التي تحدث عند الإبلاغ عن تسلسلات خطرة، حيث أظهرت الأبحاث أن الطريقة التقليدية لفحص الطلبات تتسبب في معدلات خداع كاذب تصل إلى 100% عند ظهور تسلسلات خطرة من عائلات تصنيفية غير موجودة في مجموعة البيانات المعتمدة. بالاستناد إلى مفهوم "التحكم في المخاطر المتوافقة" وقيود معدلات الأخطاء، استخدم الباحثون إشارات متعددة تم اشتقاقها من التعليقات العامة على أوامر التخليق.

تتضمن هذه الإشارات ثلاث إشارات رئيسية: التشابه جكاردي (Jaccard similarity) مع السموم المعروفة، ومعدل المتوسط المقطوع من لجنة تقييم مكونة من خمسة نماذج لغوية ضخمة (LLMs)، والتشابه الكوني (cosine similarity) مع مراكز التكتلات. عند دمج هذه الإشارات باستخدام مُجمع (aggregator) لوجستي أحادي الاتجاه وتعديله بواسطة التحكم في المخاطر المتوافقة، استطاع النموذج أن يصل إلى معايير دقة غير مسبوقة.

في التجارب التي أجريت على نطاقات مختلفة، أظهر الفاحص المُعدل نتائج مذهلة، حيث حقق معدل خطأ يصل إلى 0% عبر عشرة فحوصات لعينات مختلفة. وهذا يعني أن النموذج ليس فقط فعالًا لكن أيضًا موثوق به بنسبة عالية في الكشف عن المخاطر، وهو ما كان يعتبر تحديًا كبيرًا سابقًا في هذا المجال.

لتحقيق مستوى موثوقية يصل إلى 0.001، يحتاج النموذج إلى مجموعة بيانات أكبر 18 مرة، وهو ما يمكن أن يقدمه مجموعة البيانات المراجعة الكبيرة الخاصة بـ UniProt KW-0800. إن هذا الابتكار يعكس كيف يمكن أن تكون البيانات التمهيدية أكثر أهمية من الخوارزميات المعقدة، مما يؤدي إلى تحسينات كبيرة في طرق الفحص والتأكد من سلامة التطبيقات في مجال تخليق الحمض النووي.