في عالم الكيمياء المعقد، يُعتبر توقع التخليق أحد الأدوات الحيوية التي تساعد الباحثين في تحديد المواد المتفاعلة اللازمة لتكوين جزيء معين. وعلى الرغم من التقدم الذي أحرزته نماذج اللغات الكبيرة (Large Language Models) مؤخرًا، إلا أن معظم الطرق التقليدية إما تولد مواد متفاعلة بشكل مباشر أو تقدم تحليلات عامة دون التعمق في استراتيجيات تفكيك الروابط التي تبرر اختيارات المواد المتفاعلة.
هنا يأتي دور نموذج 'ريتروريزنر' (RetroReasoner) الثوري، الذي يعمل على التقاط التفكير الاستراتيجي للكيميائيين من خلال منهجية تفكيك الروابط. تم تدريب هذا النموذج باستخدام أساليب التعلم المشرف (Supervised Fine-Tuning) والتعلم المعزز (Reinforcement Learning)، مما يعكس تفكير الكيميائيين في كيفية تفكيك الجزيئات.
في مرحلة التدريب على التعلم المشرف، يقوم نموذج SyntheticRetro بإنتاج مبررات تفكيك منظمة مقترنة بتوقعات المواد المتفاعلة. بينما يستفيد التعلم المعزز من مكافأة جولة العودة (Round-trip Reward) في تقييم المواد المتفاعلة المتوقعة عبر نماذج التخليق الأمامية، مما يعزز من فعالية التنبؤ.
علاوة على ذلك، يمكن تطبيق ريتروريزنر على التخطيط متعدد الخطوات للتخليق من خلال دمجه في إطار عمل بحث شجرة مونت كارلو المعززة (Monte Carlo Tree Search Framework)، مما يقلل من وقت البحث ويزيد من عدد و تنوع المسارات التخليقية الصالحة.
تظهر النتائج التجريبية أن 'ريتروريزنر' يتفوق على النماذج السابقة بما في ذلك نماذج اللغات الجزيئية ونماذج الخبراء الخاصة بالتخليق، مما يوسع نطاق الاقتراحات الممكنة للمواد المتفاعلة، خاصة في الحالات التفاعلية المعقدة. يعد هذا النموذج خطوة كبيرة نحو تحسين دقة وتنوع خيارات البحث في علوم الكيمياء.
ريتروريزنر: ثورة في توقع التخليق الاستراتيجي للمواد الكيميائية
يعتبر ريتروريزنر (RetroReasoner) نموذجًا مبتكرًا في تحليل التخليق الاستراتيجي يعزز من قدرة الكيميائيين على توقع المواد المتفاعلة بدقة. من خلال دمج تقنيات التعلم المعزز، يقدم هذا النموذج نتائج تفوق سابقيه ويتيح فهمًا أعمق لأساليب تفكيك الروابط الكيميائية.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
