في عالم العلوم المعتمدة على البيانات، تصبح الخوارزميات في قلب البحث العلمي، حيث يتم ذكرها في الأوراق الأكاديمية لأغراض متعددة مثل الوصف، والاستخدام، والمقارنة، وتحسين الأساليب المستخدمة في مهام بحث محددة.

هذه الدراسة تقدم إطاراً على مستوى الجمل يهدف إلى تحديد وتحليل وتتبع دوافع ذكر الخوارزميات. حيث تتم عملية التعرف على الكيانات الخوارزمية والجمل المتعلقة بها من خلال التوضيح اليدوي وتعلم الآلة. بعد ذلك، يتم تصنيف دوافع الذكر باستخدام نماذج مسبقة التدريب وزيادة البيانات، مع تحليل توزيعها وتطورها الزمني.

تشير النتائج إلى أن نماذج التعلم العميق المدربة على البيانات المعززة تتفوق على نماذج تعلم الآلة التقليدية في تصنيف الدوافع. وفي أوراق معالجة اللغة الطبيعية، يُظهر أكثر من نصف الجمل المتعلقة بالخوارزميات تعبيرًا عن الاستخدام المباشر، بينما تعتبر دوافع التحسين من بين الأقل شيوعًا.

على مر الزمن، ازدادت تنوع الدوافع، حيث يتم ذكر الخوارزميات المعتمدة على القواعد بشكل أكبر لوصفها، بينما تُستخدم خوارزميات التعلم الآلي في أغلب الأحيان للاستخدام.

تتغير دوافع الاستخدام تدريجيًا لتحل محل دوافع الوصف عبر مختلف الخوارزميات، كما انخفض عدد أنواع الدوافع المرتبطة بالخوارزميات الفردية بشكل كبير. هذه الدراسة تكشف عن كيفية ذكر المؤلفين للكيانات الخوارزمية في الكتابات الأكاديمية، وتقدم أساسًا للبحث المستقبلي حول تحديد علاقات الخوارزميات وتقييم آثارها.