تعتبر الكيمياء فوق الجزيئية (Supramolecular Chemistry) واحدة من المجالات الرائدة التي تعنى بدراسة التجمعات غير التساهمية بين العناصر، لكنها غالبًا ما تعاني من صعوبة تصميم أنظمة الضيافة والضيوف على نحو فعّال. يستغرق هذا التصميم وقتًا طويلاً في المختبرات التقليدية، حيث قد تحتاج العملية إلى أيام من التحقق الجاف لكل زوج مرشح. ومع بروز نماذج اللغة الكبيرة (Large Language Models) كبديل سريع وأداء قوي في مهام ربط الجزيئات، لم يكن هناك معيار يقيم هذه النماذج في سياق الكيمياء فوق الجزيئية.

لتجاوز هذه الفجوة، أُطلق معيار SupraBench بالتعاون مع خبراء في المجال لتقييم نماذج اللغة الكبيرة في مهام اللغة الكيميائية. يشمل هذا المعيار أربعة مهام أساسية:
1. **تنبؤ قوة الربط**
2. **اختيار أفضل الجزيئات**
3. **تحديد المذيب**
4. **وصف الضيافة والضيوف**
كما يتضمن معيارًا إضافيًا يعتمد على الرؤية لمساعدة في التعرف على الجزيئات.

للمساهمة في هذا المشروع، تم إطلاق قاعدة بيانات SupraPMC، التي تحتوي على 16 مليون توكن من مقالات الكيمياء فوق الجزيئية المقتبسة من مستودع الأوراق الأكاديمية الأوروبي.

تحليل النتائج يُظهر أن هناك مجالًا كبيرًا للتحسين عبر جميع المهام المُختبرة، حيث يكشف التنسيق السابق للبيانات عن نقاط ضعف واضحة في استنتاجات الكيمياء فوق الجزيئية الحالية. يمكن الاطلاع على شفرة المصدر ومجموعات البيانات الخاصة بالمعيار على GitHub.

ما رأيكم في هذه الابتكارات الجديدة في الكيمياء؟ هل تعتقدون أنها ستحدث ثورة في الأبحاث؟ شاركونا آرائكم في التعليقات.