في عالم العلوم الكيميائية، يعد التعرف على الهياكل الكيميائية (Optical Chemical Structure Recognition - OCSR) خطوة حاسمة ضمن الأبحاث. ومع ذلك، فإن الأنظمة الحالية لا تزال تواجه تحديات كبيرة عند التعامل مع الصور المعقدة التي تتواجد في الأدبيات العلمية. للتغلب على هذه العقبات، أعلن الباحثون عن إطلاق إطار العمل الجديد المعروف بـ MolRecBench-Wild، الذي يوفر معايير جديدة للتقييم في ظروف العالم الحقيقي.

يستخدم MolRecBench-Wild إطار عمل متقدم يعرف باسم MOSAIC، وهو نظام يقيّم التحديات البصرية والكيميائية المرتبطة بالرسوم البيانية الجزيئية من خلال 37 تصنيف دقيق. تتضمن هذه التحديات التنوع البصري والرمزية الكيميائية التي تمثل الأمور يتعذر على الأنظمة الحالية فهمها بشكل دقيق. يعتمد هذا البحث العلمي على مجموعة بيانات ضخمة تحتوي على 5,029 هيكلًا جزيئيًا تم استخراجها من 820 ورقة بحثية حديثة في الكيمياء، مما يغطي طيف صعوبات واسع كما يظهر في المنشورات الواقعية.

لتحقيق تقييم دقيق يتجاوز استخدام أساليب التعريف التقليدية مثل SMILES وMolFile، تم تقديم لغة تمثيلية جديدة تحت مسمى CARBON. تتميز CARBON بقدرتها على التعبير عن التغيرات في الترتيبات الكيميائية ومجموعات رمزية غير اعتيادية، مما يجعلها أداة قوية للموديلات الحديثة.

علاوة على ذلك، يعتمد الباحثون بروتوكول تقييم مزدوج يتيح التوافق مع كل من مخرجات CARBON وSMILES، لضمان تغطية شاملة لمختلف النماذج المتاحة في السوق.

ومع إجراء تجارب شاملة عبر 18 نموذجًا قادرًا على OCSR، تم الكشف عن تدهور كبير في الأداء عند استخدام MolRecBench-Wild، مما يبرز الفجوة الكبيرة بين المعايير السابقة التي تم اختبارها في براءات الاختراع والسيناريوهات الأكاديمية الواقعية.

هل ترى أن هذا التحول في معايير التقييم سيحدث ثورة في طرق التعرف على الهياكل الكيميائية؟ شاركونا آراءكم في التعليقات.