في عالم يتزايد فيه استخدام أنظمة أندرويد، يبرز التهديد المتزايد للبرمجيات الخبيثة (Malware) بشكل ملفت. لذا، كان من الضروري تطوير أدوات جديدة لمواكبة هذا التحدي، وهنا تأتي أهمية مجموعة بيانات MASCOT-Android.

تعتبر مجموعة بيانات MASCOT-Android أولى خطواتنا نحو إنشاء مكتبة شاملة من كود البرمجيات الخبيثة، حيث تعكس بوضوح نوايا المهاجمين الأصلية. لكن، جمع كود البرمجيات الخبيثة بدوام أمرًا معقدًا بسبب نقص البيانات وارتفاع تكاليف المراجعة اليدوية.

ما يجعل MASCOT-Android مميزاً هو نظام الجمع الآلي الذي يقترن به، والذي يمكن من اكتشاف كود البرمجيات الخبيثة بشكل متوسع ومنظم على منصة GitHub. النتائج تشير إلى أن الوثائق على مستوى المستودعات توفر إشارة قوية لجمع كود البرمجيات الخبيثة.

من خلال تحليل 8,772 مستودعًا يحتوي على برمجيات خبيثة و25,747 مستودعًا من البرمجيات الصالحة، استطاع النموذج استخراج ميزات TF-IDF على مستوى الحروف (Character-level TF-IDF features) وتدريب مصنف LinearSVC ليميز بين المستودعات. وقد أظهرت النتائج دقة تصل إلى 96.28% ومعدل إيجابي زائف (FPR) بلغ 1.06% في التقييم المحلي.

بالإضافة إلى ذلك، يوفر النموذج درجات ثقة، مما يمكّن المستخدمين من تعديل حدود القرار لتحقيق توازن بين معدل الإيجابيات الزائفة والتغطية، مما يجعل هذا النموذج عملاً بارزًا في جمع كود البرمجيات الخبيثة في العالم الحقيقي. تعتبر هذه التقنيات خطوة كبيرة نحو تعزيز الأمن السيبراني في بيئات أندرويد المليئة بالتحديات.

ما رأيكم في هذا التطور؟ هل تعتقدون أن هذه الأدوات ستساعد في مواجهة تهديدات البرمجيات الخبيثة بشكل أكثر فعالية؟ شاركونا في التعليقات!