في عالم الكيمياء الكمومية المتقدم، يواجه الباحثون تحديًا كبيرًا يتمثل في تكلفة إنتاج بيانات تدريب عالية الدقة. ومع ذلك، تتمثل الحلول الحديثة في استخدام التعلم الآلي، الذي شهد تقدمًا ملحوظًا ولكن تعوقه التكلفة الباهظة لجمع هذه البيانات.

تقدم خوارزمية التعلم الآلي بوجود دقة متعددة (Multifidelity Machine Learning - MFML) حلاً مبتكرًا، حيث تقوم بدمج بيانات منخفضة الدقة بوفرة مع بيانات نادرة عالية الدقة، مما يساعد في تخفيض التكاليف. لكن، تعتمد الأساليب التقليدية على عوامل محددة مسبقًا لتحديد نسبة البيانات عبر درجات الدقة، مما يؤدي إلى إنتاج بيانات متعددة الدقة غير فعالة.

تُقدم هذه الورقة البحثية إطارًا مبتكرًا يُعرف باسم Adaptive On-the-Fly Multifidelity Framework، الذي يحدد بشكل مستقل مكونات مجموعة بيانات التدريب. من خلال الاستعلام الديناميكي عن عينات التدريب عند كل درجة دقة، saturates خوارزمية الـMFML الجديدة دقة النموذج عند الدرجات الأقل قبل الانتقال إلى حسابات أكثر تكلفة.

لقد تم اختبار الخوارزمية الجديدة عبر مجموعة متنوعة من الخصائص الكيميائية، بما في ذلك طاقات الكتلة الرباطية التي تُعتبر معيارًا ذهبيًا في الكيمياء الحسابية، وطاقة الإثارة الأكثر تحديًا. تظهر التجارب الرقمية أن هذه الخوارزمية الجديدة تقلل تكاليف إنتاج البيانات بما يصل إلى 30 ضعفًا مقارنةً بالطرق التقليدية ذات الدقة الواحدة، كما تحسن عن الأساليب القياسية للـMFML بمعدل يصل إلى 5 مرات.

هذا التطور الرائع يفتح أمامنا مسارًا عابرًا للتحديات، من خلال توفير طريق مستدام وذو كفاءة تكلفة في التعلم الآلي للكيمياء الكمومية. أساليب مثل هذه تعد بمستقبل أكثر إشراقًا في مجال التعلم الآلي ودعم الابتكارات العلمية.