استغلت الأبحاث المالية والاقتصادية بشكل تقليدي البيانات الهيكلية الخاصة بسلاسل التوريد وقواعد البيانات التجارية. في الصين، تُقتصر الإعلانات المتعلقة بالموردين والزبائن عادة على الشركاء الرئيسيين للشركات المدرجة، مما يترك الشركات غير المدرجة والترابطات بين الشركات الشريكة غير موثقة بشكل كافٍ. تتيح الأدلة العامة عبر الإنترنت، مثل بيانات الشركات والحكومة ووسائل الإعلام التجارية، جزءاً من سد هذه الفجوة، ولكن عملية استخراج البيانات الكاملة من الويب تواجه تحديات بسبب صعوبة الوصول إلى الصفحات أو تكلفتها العالية عند استخدام نماذج اللغة الضخمة (Large Language Models).
تقترح الدراسة الجديدة نهجاً جديداً يعتمد على المقتطفات (snippets) لبناء رسم بياني معرفي لسلسلة التوريد (SCKG) يشمل الشركات كنقاط وعلاقاتهم كحواف. يعتبر المقتطف مرجعاً ملخصاً يستخلص من نتائج البحث ويستخدم كطبقة أولية قابلة للتوسع لاستخراج العلاقات باستخدام نماذج اللغة الضخمة.
أظهرت التقييمات أن كفاءة الاستخراج عالية، حيث يكتشف الحل الكامل 19.8 مرة أكثر من العلاقات الفريدة مقارنة بالمقتطفات، لكنه يتطلب 251.2 مرة أكثر من الرموز المدخلة مما يؤدي إلى زيادة التكرار. وعند النظر إلى التغطية، استخدمت الدراسة 130,685 شركة صينية كنقاط بحث، شاملة الشركات المدرجة في بورصات شنغهاي وشنتشن والشركات الكبيرة غير المدرجة. تمكّن رسم بياني سلاسل التوريد الناتج من تغطية 7.2 مرة أكثر من الشركات و9.3 مرات أكثر من العلاقات مقارنة بمعايير الإفصاح الموجودة. بالإضافة إلى ذلك، توفر المعلومات المرتبطة بيانات موثوقة للدعم والفحص مما يجعل الـ SCKG بمثابة مكمل يمكن التحقق منه للبيانات المعتمدة على الإفصاح.
اكتشاف سلاسل التوريد المعتمدة على مقتطفات: تعزيز الرؤية في الصين باستخدام نماذج اللغة الضخمة
تسعى الدراسة الجديدة لاستغلال نماذج اللغة الضخمة لبناء رسم بياني معرفي لسلاسل التوريد في الصين، مما يساعد على سد الفجوات المتعلقة بالبيانات التي تفتقر إليها الشركات الغير مدرجة. الطريق الجديد يعزز الروابط بين الشركات ويزيد من كفاءة استخراج المعلومات.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
