في خطوة غير مسبوقة تساهم في توظيف الذكاء الاصطناعي في القطاع المالي، تم تقديم FinVerBench، وهي أداة مبتكرة تهدف إلى تقييم مدى صحة البيانات المالية للشركات. تعتمد هذه الأداة على تحليل المعلومات المتاحة للنماذج اللغوية الكبيرة (Large Language Models) لتحديد ما إذا كانت مجموعة من البيانات المالية تتسم بالتماسك الرقمي.
تم تطوير FinVerBench بناءً على ملفات SEC 10-K XBRL لـ 43 شركة من شركات S&P 500، حيث تحدد أربعة فئات لأخطاء التقييم تشمل الأخطاء الحسابية، الربط عبر البيانات المالية، الاختلافات السنة بعد سنة، والتحولات الكمية.
وفي إطار هذا المشروع، تم إجراء 15 تقييمًا حديثًا للنماذج اللغوية الكبيرة، نتج عنها تنفيذ 14 منها بشكل كامل، في حين تم استبعاد التشغيل الخاص بـ Gemini 2.5 Pro من المقارنة الرئيسية نظرًا لفشل 40 من أصل 108 اتصالات.
تساعد هذه المعايير في تحليل مدى تأثير خيارات إدارة التقييم على دقة النتائج: على سبيل المثال، أظهرت النماذج نسبة استدعاء تبلغ 79.0% مع عدم وجود إيجابيات كاذبة، مقارنة بنسبة 100.0% من الاستدعاء على مجموعة بيانات غير مُدورة.
تدعم هذه النتائج الاستنتاج بأن تقييم البيانات المالية يتجاوز الكشف الحسابي ليشمل حكمًا مُعتمدًا في ظل عدم اكتمال الرؤية، واستخدام الافتراضات المعتمدة على الطلب، وتقديم الأرقام بشكل واقعي. يمكن للجميع الآن الوصول إلى FinVerBench وكود البرمجة الخاص به بشكل علني.
ثورة في تدقيق البيانات المالية: اكتشفوا FinVerBench في عالم الذكاء الاصطناعي!
تقدم FinVerBench أداة مبتكرة لتقييم صحة البيانات المالية للشركات، من خلال دراسة عميقة لدقة نماذج الذكاء الاصطناعي في هذا المجال. تعلن هذه المبادرة عن إمكانية تحسين أداء نماذج اللغة الكبيرة (LLMs) في تقييم البيانات المالية.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
