تعتبر القدرة على تفسير البيانات الرقمية في التقارير المالية أمرًا بالغ الأهمية للأسواق والجهات التنظيمية. ومن المعروف أن لغة التقارير التجارية القابلة للتوسيع (XBRL) توفر معيارًا لتصنيف الأرقام المالية، لكن ربط الآلاف من الحقائق بأكثر من 10,000 مفهوم من معايير المحاسبة المالية الأمريكية (US GAAP) لا يزال عملية مكلفة ومعرضة للأخطاء.

تواجه المعايير الحالية تحديات كبيرة، حيث تعتمد على تصنيف مبسط يتسم بالخطية ولا يأخذ في الاعتبار دلالات الهيراركية الموجودة في التصنيف وطبيعة الملفات المالية المهيكلة. وقد أدت هذه العيوب إلى عدم قدرة هذه المعايير على تقييم أداء نماذج اللغات الضخمة (Large Language Models) في ظل ظروف للتقارير الواقعية.

لملء هذا الفراغ، يقدم الباحثون FinTagging، وهو أول معيار شامل يركز على التصنيف المدعوم بالهيكلية وكامل النطاق لتصنيفات XBRL. حيث يقسم العملية المعقدة لتصنيف المعلومات إلى مهمتين فرعيتين:

1. **FinNI (تحديد الأرقام المالية)**: التي تعمل على استخراج الكيانات والأنواع من سياقات متنوعة تشمل النصوص والجدول.
2. **FinCL (ربط المفاهيم المالية)**: التي تهدف إلى ربط الكيانات المستخرجة بالتصنيف الكامل لمعايير GAAP.

تسمح هذه الصيغة ذات الخطوتين بتقييم عادل لقدرات نماذج الذكاء الاصطناعي في التفكير الرقمي والمواءمة مع التصنيفات. وقد أظهر تقييم نماذج متنوعة في ظروف بدون تدريب سابق أن هذه النماذج تتفوق في استخراج المعلومات، لكنها تواجه صعوبات عديدة في ربط المفاهيم بشكل دقيق، مما يبرز قيودًا جوهرية في قدرة النماذج على التفكير الهيكلي المتخصص.