تُعتبر مهمة الكشف عن الشذوذ في الرسوم البيانية (Graph Anomaly Detection - GAD) من المهام الحيوية في مجال تعلم الآلة، حيث نجد لها تطبيقات بارزة في مجالات مثل كشف الاحتيال المالي وحوكمة المنصات الاجتماعية. ولكن، واجهت المعايير الحالية للأبحاث في هذا المجال قيدًا كبيرًا بسبب اعتمادها على رسوم بيانية صغيرة الحجم ومنظمة، مما أدى إلى فجوة واضحة بين التقييم الأكاديمي وما يمكن تحقيقه في الواقع.
لسد هذه الفجوة، تم تقديم معيار جديد متعدد الأبعاد يُقيم نماذج الكشف عن الشذوذ في الرسوم البيانية (GAD) تحت ظروف تطبيق حقيقية تدور حول ثلاثة تحديات رئيسية: الرسوم البيانية بالحجم مليون، الفقر الشديد للتشوهات، وفقدان خصائص العقد. تم اشتقاق عائلة من النسخ القياسية من خمسة رسوم بيانية متنوعّة، بما في ذلك مجموعتين من البيانات الصناعية التي تضم أكثر من 3.7 مليون عقدة.
أظهرت تقييمات شاملة لتسعة نماذج GAD تمثيلية عدة قيود رئيسية، منها: أولًا، فشلت معظم الطرق المعتمدة على الشبكات العصبية (GNN) في التكيف مع الرسوم البيانية التي تحتوي على مليون عقدة بسبب متطلبات الذاكرة الكبيرة. ثانيًا، انخفض أداء الكشف بشكل حاد تحت النسب الحقيقية للتشوهات، حيث وصلت أحيانًا إلى نسبة 0.1% مما أدى إلى عدم القدرة على استعادة أي من النتائج. ثالثًا، كانت النماذج المعتمدة على إعادة البناء حساسة للغاية لاستراتيجيات ملء الخصائص المفقودة.
تدل النتائج على أن الأداء الجيد في البيئات المخبرية لا يضمن الثبات في بيئات الإنتاج. لهذا تم إصدار هذا المعيار والتقييم التجريبي كاختبار تشخيصي لتحفيز تطوير أنظمة كشف الشذوذ في الرسوم البيانية القابلة للتوسع والموثوقة للبيانات الكبيرة وغير المتوازنة التي تواجهها التطبيقات العملية.
تحديات الكشف عن الشذوذ في الرسوم البيانية: معيار جديد للتغلب على العقبات الحقيقية!
تقدم دراسة جديدة معيارًا مبتكرًا للكشف عن الشذوذ في الرسوم البيانية، يهدف إلى سد الفجوة بين الأبحاث الأكاديمية والتطبيقات الحقيقية. هذه الدراسة تكشف عن عوائق رئيسية تواجه نماذج الذكاء الاصطناعي في التعامل مع بيانات ضخمة وغير متوازنة.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
