في عصر البيانات الضخمة، يسعى الباحثون والمحللون للتغلب على التحديات المرتبطة بالبيانات المالية غير المنظمة. يقدم البحث الجديد إطارًا تعاونيًا يُعرف بـ GraphRAG، يهدف إلى تحسين تحليل بيانات السجلات التجارية بشكل فعّال.

السجلات العامة تكون متاحة رسميًا، ولكنها تحمل في طياتها العديد من التعقيدات. فالبيانات الهيكلية غالبًا ما تتداخل مع كميات هائلة من النصوص القانونية غير المنظمة، مما يجعل البحث التقليدي بواسطة الكلمات الرئيسية أو الأساليب المستندة إلى المتجهات أمرًا صعبًا، خاصةً في التحليلات التي تحتاج إلى ربط معلومات متعددة وتحديد الكيانات.

إطار GraphRAG يشتمل على ثلاث مراحل رئيسية:
1. **استيراد موثوق**: تضمين العقد القوية من الحقول الهيكلية المعتمدة.
2. **الاستخراج المدعوم بالنماذج اللغوية**: استخراج العقد الضعيفة من الإشعارات غير المنظمة باستخدام نماذج لغوية ضخمة (Large Language Models).
3. **تحقيق الهوية وإزالة التكرار**: التأكد من دقة البيانات وتفادي التكرارات.

بعد إنشاء الرسم البياني، يقدم النظام وكيلًا تحليليًا موديوليًا يجمع بين توجيه النية بدون تدريب، حلقة انعكاسية محكومة، والوصول الآمن إلى الرسم البياني. كما يتاح للمستخدمين لوحة عرض تفاعلية لإظهار الأدلة وتتبع التنفيذ لضمان الشفافية والمراجعة.

خضع إطار GraphRAG للاختبار باستخدام النشرة الرسمية للتجارة السويسرية، التي تحتوي على أكثر من سبعة ملايين نشر على مدار سبع سنوات. ونتيجة لذلك، أظهر النظام أداءً متفوقًا في دقة تحديد الكيانات، وسلوك توجيه الأدوات، وجودة الإجابات، وأداء المحادثات متعددة الدور.

يبرز هذا الإطار كحل مبتكر يمكن نقله إلى سجلات تجارية عامة أخرى وأنظمة تسجيل في القطاع العام، مما يؤكد على أهمية استخدام الذكاء الاصطناعي في تعزيز دقة وجودة تحليل البيانات.