تتزايد أهمية تقييم جودة البيانات الضخمة (Big Data Quality Assessment) بشكل كبير في ظل الثورة الرقمية التي نعيشها. لكن، تواجه الحلول الحالية تحديات كبيرة في تحقيق تقييم دقيق يعتمد على السياق. هنا تظهر أهمية الدراسة الجديدة التي تقدم نهجاً مبتكراً معتمداً على الرسوم البيانية للمعرفة (Knowledge Graph Embeddings).
هذا البحث يستعرض طريقة تعتمد على الرسوم البيانية للمعرفة لتعزيز تقييم جودة البيانات بشكل تلقائي. تكمن الفكرة في استخدام هذه الرسوم للتنبؤ بالاتصالات المفقودة بين تمثيل سياق مجموعة البيانات المدخلة والقواعد والمعايير المهنية لجودة البيانات الممثلة في الرسم البياني.
لأننا ندمج تمثيلات متنوعة ضمن الرسم البياني، نستفيد من المعلومات السياقية التي تم الحصول عليها من دراسة الأدبيات الموثوقة. هذه العملية توفر لنا خطة متكاملة لتقييم جودة البيانات تتناسب مع كل سياق على حدة. وبذلك، تساعد الرسوم البيانية في تحسين فهمنا للسياق المتعلق بمجموعة البيانات المدخلة، متجاوزة عيوب الطرق التقليدية التي تعتمد فقط على المطابقة الصارمة.
ينطوي هذا البحث على إضافة خصائص عددية للحواف المتوقعة، مما يُعطي أوزاناً معينة لكل قياس نوعية متوقع، وبهذا نوفر خطة شاملة لتقييم جودة البيانات المدخلة. لتقييم فعالية هذا النهج، استخدمنا **AmpliGraph**، وهو إطار عمل تم تطويره من قبل **AccentureLabs** وتم اختباره بشكل موثوق.
أظهرت النتائج المستخلصة من تقييم مجموعة بيانات حساسات الإشعاع المقدمة من **المفوضية اللبنانية للطاقة النووية (LAEC-CNRS)** قدرة هذا الحل على توليد خطة شاملة لتقييم جودة البيانات لمجموعة البيانات المعطاة.
باختصار، هذه الدراسة تفتح آفاق جديدة لدراسات جودة البيانات من خلال تقديم نهج يمتزج فيه الذكاء الاصطناعي مع المعرفة، مما يعزز فرص النجاح في إدارة البيانات الضخمة بشكل أكثر فاعلية.
تحسين تقييم جودة البيانات الضخمة باستخدام الرسوم البيانية للمعرفة!
تستعرض دراسة جديدة طريقة مبتكرة لتحسين تقييم جودة البيانات الضخمة من خلال دمج الرسوم البيانية للمعرفة، متجاوزة طرق التقييم التقليدية. توفر هذه الطريقة آلية شاملة وفعالة لتقييم جودة البيانات في السياقات المختلفة.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
