في عالم الذكاء الاصطناعي، يتسارع الابتكار بشكل مذهل، ومن أبرز هذه الابتكارات هو Yeti، المحلل الجديد لهياكل البروتين. يعتمد هذا النموذج على تقنيات التحويل الأحدث، التي تسمح بجمع وتفسير تسلسلات البروتين وهياكلها ووظائفها في تمثيل موحد. إن إمكانية دمج البيانات متعددة الأنماط وتوليد بروتينات جديدة بمواصفات مُعينة يجعل من Yeti أداةً ثمينة في مجال البحث العلمي.

تتطلب نماذج الذكاء الاصطناعي المعتمدة على العمارة التحويلية (Transformer) وجود محول (Tokenizer) لهذا الغرض، يقوم بتحويل الإحداثيات الذرية المستمرة للبروتين إلى تمثيلات منفصلة تناسب التدريب متعدد الأنماط بشكل قابل للتوسع. يعتمد أداء هذه النماذج بشكل كبير على جودة الهيكل المُحوّل، إلا أن أغلب المحولات الموجودة تركز على عملية إعادة البناء بدلاً من القدرة على توليد بيانات جديدة.

استجابة لهذه الثغرات، تم تقديم Yeti، الذي يتميز بعدم استخدام قاعدة بيانات بحثية معقدة، ويدرب بشكل شامل باستخدام هدف مطابقة التدفق بهدف التعلم متعدد الأنماط. عند مقارنتها بالنماذج الحالية، يحقق Yeti الاستخدام الأفضل لرمز الكتابة وتنوع الرموز، بالإضافة إلى دقة إعادة البناء العالية، وذلك بأقل عدد من المعلمات.

لتأكيد قدرة Yeti على توليد الهياكل، تم تدريب نموذج متعدد الأنماط بتنسيق مخفف مع هياكله ورموز التسلسل الأميني من البداية، دون الحاجة لأي إعداد مسبق. النموذج الناتج أثبت قدرته على إنتاج هياكل محتملة بشكل متزامن مع تسلسل البروتين، محققًا نتائج تقارن بالنماذج الكبرى التي تزيد بحوالي 10 مرات.

إجمالاً، يبرز Yeti كحل مدمج ومعبر يُمكن استخدامه في تدريب نماذج متعددة الأنماط التي تولّد تسلسلات وهياكل موثوقة للغاية. فما رأيكم في هذا التطور المثير؟ شاركونا في التعليقات!