في عالم تحليل البرمجيات الخبيثة، يُعتبر وجود مجموعات بيانات شاملة أمرًا حيويًا، خاصة حين يتعلق الأمر بفهم الهياكل المعقدة للبرامج. هنا يأتي الدور الرائد لمجموعة بيانات هيجراب (HiGraph) التي تمثل إنجازًا مهمًا في هذا المجال، حيث تُعتبر الأكبر من نوعها لعلاج التحديات المرتبطة بتحليل البرمجيات.

تحمل هيجراب في جعبتها أكثر من 200 مليون رسم بياني لتدفق التحكم (Control Flow Graphs) موزعة على 595 ألف رسم بياني لاستدعاء الدوال (Function Call Graphs)، مما يوفر نموذجًا هرمياً يساهم في الحفاظ على الدلالات الهيكلية اللازمة لبناء أنظمة كشف قوية قادرة على مواجهة تقنيات التعتيم وتطور البرمجيات الخبيثة.

تعمل مجموعة البيانات هذه على معالجة نقاط الضعف الموجودة في الطرق الحالية، التي غالبًا ما تبسط البرامج إلى رسومات بيانية لمستويات واحدة، مما يؤدي إلى تجاهل العلاقات المهمة بين التفاعلات الوظيفية العليا ومنطق التعليمات في المستوى الأدنى. عبر تحليل شامل، قامت الدراسة بإظهار خصائص هيكلية واضحة تميز البرمجيات الخبيثة عن البرامج السليمة، مما يجعل هيجراب معيارًا أساسيًا يُعتمد عليه في المجتمع الأكاديمي والتقني.

لمزيد من المعلومات، يمكن زيارة الموقع الرسمي لمجموعة بيانات هيجراب على الرابط https://higraph.org.