مع تزايد قدرات نماذج اللغات الضخمة (LLMs) في الأبحاث البيولوجية، من كتابة النصوص الأدبية إلى تفسير البيانات التجريبية، أصبح لدينا الآن أداة جديدة لقياس هذه القدرات. نقدم لكم ABC-Bench، معيارًا يعمل على تقييم القدرات البيولوجية ونقاط القوة والضعف لنماذج الذكاء الاصطناعي.

يتجاوز معيار ABC-Bench مجرد تقييم دقيق للقدرات البيولوجية، حيث يقيم نماذج الذكاء الاصطناعي عبر مجموعة متنوعة من المهام التي تتعلق بكل من تطبيقات البيولوجيا الجيدة واستخدامات قد تكون ثنائية الاستخدام. ومن بين هذه المهام كتابة الأكواد لتشغيل روبوتات معالجة السوائل، وتصميم شظايا الحمض النووي (DNA) للتجميع المختبري، وتجنب الفحوصات المرتبطة بتخليق الحمض النووي. وتتطلب هذه المهام مزيجًا متقنًا من المعرفة البيولوجية والخبرة البرمجية.

عند اختبار نماذج التعلم الآلي، أظهر جميع وكلاء النماذج قدرة تفوق المتوسط البشري في جميع المهام الثلاث. أظهرت النتائج أن النماذج أدت بشكل ممتاز في المهام التي تعتمد على المعرفة المنشورة والبروتوكولات المعروفة، ولكن كانت نتائجها أقل في المهام التي تتطلب تفكيرًا في المعلومات البيولوجية الجديدة.

تضمنت التجارب المعملية التي أجريت للتحقق من النتائج، تجربةً مع OpenAI's o4-mini-high، والذي أنتج أكواد تم تشغيلها على روبوت معالجة السوائل OpenTrons، وأنجزت تجميع الحمض النووي بنجاح مع الترتيبات المتوقعة.

إن ABC-Bench لا يزيد فقط من فرص الاكتشافات العلمية والتقدم في مجالات الطب الحيوي، بل يعيد تعريف المخاطر المتعلقة بأمن البيولوجيا. كيف يمكن أن تؤثر هذه التطورات على مستقبل الأبحاث البيولوجية؟ انضموا إلينا في مناقشة هذا الموضوع المهم!