في عالم البيانات المتزايد تعقيداً، تُعتبر الرسوم البيانية المعرفية (Knowledge Graphs) أحد الأدوات الأساسية لتنظيم المعلومات وربطها بشكل هادف. ومع ذلك، تظل عملية إنشائها من بين أكثر المهام استهلاكًا للوقت والجهد للمهندسين المعرفيين، حيث يتوجب عليهم تحديد القيم الدلالية بين مصادر البيانات المدخلة والمصطلحات الأنطولوجية.

لقد أدت الحلول القابلة للتصريح مثل RML وSPARQL-Anything إلى بعض التحسينات، لكن لا يزال التوافق بين عناصر مخطط الإدخال والمصطلحات الأنطولوجية يتطلب تحولات معقدة وجهودًا كبيرة من الأيدي البشرية. ومع ظهور نماذج اللغة الكبيرة (LLMs)، برز الاهتمام في استغلال إمكانياتها لمساعدة مهندسي الرسوم البيانية المعرفية.

عرضت بعض الدراسات استخدام LLMs لأتمتة بناء الرسوم البيانية، ولكن لم يكن هناك إطار موحد لتقييم كفاءتها في تأسيس المطابقات بين مخططات البيانات ومفاهيم الأنطولوجيا. هنا يأتي الابتكار الجديد، BLINKG، والذي يُعَد معيارًا مصممًا لتقييم قدرات LLMs في إنشاء الرسوم البيانية المعرفية من مصادر بيانات متنوعة.

يتضمن هذا المعيار مجموعة من السيناريوهات ذات التعقيد المتزايد، موضوعة بناءً على حالات الاستخدام الواقعية. تم إجراء تقييم تجريبي شامل لعدة نماذج لغة كبيرة متقدمة باستخدام BLINK، وتبين أن هذه النماذج تُقدم حلولًا واعدة. ومع ذلك، لا تزال أدائها محدودة في السيناريوهات المعقدة.

بفضل هذا المعيار، يمكننا الآن تقييم قدرات LLMs الحالية في بناء الرسوم البيانية المعرفية. بالإضافة إلى ذلك، وضعنا مجموعة من المتطلبات لتحقيق بناء الرسوم البيانية بشكل (نصف) آلي مدفوعًا بالذكاء الاصطناعي، مما يفتح آفاق جديدة للبحث في هذا المجال.