يُعتبر التعرف على الهياكل الكيميائية البصرية (Optical Chemical Structure Recognition - OCSR) مجالاً حيوياً في علم الكيمياء، حيث يُترجم صور الجزيئات إلى تمثيلات قابلة للقراءة من قِبل الآلات مثل سلاسل SMILES أو الرسوم البيانية الجزيئية. ومع ذلك، يواجه OCSR تحديات كبيرة في معالجة الوثائق الواقعية بسبب التباينات اللامتناهية في الهياكل الكيميائية، والاقتباسات المختصرة، والضجيج البصري.
ادعى معظم الأساليب الحالية المعتمدة على التعلم العميق إلى الاعتماد على تقنيات التحفيز التعليمي (teacher forcing) باستخدام تقدير الاحتمالية الأقصى على مستوى الرموز (Maximum Likelihood Estimation - MLE). لكن هذه الطرق تعاني من انحياز التعرض، حيث يتم تدريب النماذج تحت البدايات الحقيقية، ولكن يجب عليها الاعتماد على توقعاتها السابقة خلال الاستدلال. أيضاً، تشتت الأهداف على مستوى الرموز يعوق تحسين المعايير التقييمية على مستوى الجزيئات مثل الصلاحية الكيميائية والتشابه الهيكلي.
في هذا السياق، نقدم تقنية تدريب الحد الأدنى للمخاطر (Minimum Risk Training - MRT) لنظام OCSR ونسلط الضوء على COMO (Closed-loop Optical Molecule Recognition)، وهو إطار مغلق يساعد على تقليل الانحياز عن طريق تحسين الأهداف غير القابلة للاشتقاق على مستوى الجزيئات، من خلال أخذ عينات وتقييم توقعات النموذج بشكل دوري.
كشفت التجارب على عشرة معايير، بما في ذلك الرسوم البيانية الكيميائية الاصطناعية والواقعية من براءات الاختراع و الأدبيات العلمية، أن COMO يتفوق بشكل كبير على الأساليب القائمة على القواعد والأساليب المعتمدة على التعلم مع كمية أقل من بيانات التدريب. وأظهرت دراسات الحذف أن MRT لا يعتمد على بنية معينة، مما يدل على إمكانية تطبيقه على أنظمة OCSR شاملة.
تقنية COMO ليست مجرد خطوة إلى الأمام في التعرف على الجزيئات، بل تمثل نقطة تحول في كيفية معالجة البيانات الكيميائية. فهل سنشهد عصرًا جديدًا من الاكتشافات العلمية بفضل هذه التقنيات؟
تقدم ثوري في التعرف على الجزيئات: COMO يقود الطريق إلى تدريب منخفض المخاطر
تقدم COMO، النظام الثوري للتعرف على الجزيئات البصرية، طريقة جديدة لتقليل المخاطر والتقليل من الانحياز الناتج عن التدريب التقليدي. هذه الإبتكارات تعد بإحداث ثورة في علم كيمياء التفاعل البصري.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
