تعتبر عملية استخراج البيانات من الرسوم البيانية العلمية مهمة حيوية تتطلب دقة وجودة عالية، خصوصاً في ظل تزايد الحاجة إلى تحليل الأدبيات العلمية. ومع ظهور نماذج اللغة الضخمة (LLMs) التي تعتمد على تقنيات متعددة الوسائط، يبقى التحدي الأكبر هو تحسين دقتها عند التعامل مع الرسوم البيانية غير الموحدة.

في دراسة حديثة ناقشت فعالية استراتيجيتين مختلفتين لتحسين أداء النماذج، تم التركيز على التوجيه الدلالي (semantic priming) والتوجيه المكاني (spatial priming). وكانت الأسئلة الرئيسية تتعلق بالاستراتيجية الأكثر فاعلية لتطوير الأداء: هل هي الإرشادات الدلالية المتقدمة أم الإعدادات المكانية البسيطة؟

أظهرت التجارب التي أجراها الباحثون أن الأساليب الدلالية مثل إطار البيانات الوصفية ذو المرحلتين (two-stage metadata-first framework) وChain-of-Thought، لم تتمكن من تحقيق تحسن ذي دلالة إحصائية في الأداء. من ناحية أخرى، تم تقديم طريقة توجيه مكاني بسيطة وفعالة: وهي إضافة شبكة إحداثية (coordinate grid) فوق صورة الرسم البياني قبل التحليل.

أظهرت التجارب الكمية على مجموعة بيانات صناعية أن هذا النهج القائم على الشبكة أسهم في تقليل ملحوظ في أخطاء استخراج البيانات، حيث انخفضت نسبة الخطأ من 25.5% إلى 19.5%، مع دلالة إحصائية قوية (p < 0.05) مقارنة بالأسلوب الأساسي.

في الختام، تؤكد هذه الدراسة أن توفير سياق مكاني واضح يعد استراتيجية أكثر فعالية وموثوقية من التوجيه الدلالي لمهام استخراج البيانات الحالية، مما يشير إلى إمكانية تحسين أساليب تحليل الأدبيات العلمية المستقبلية بشكل كبير.