في عالم البيانات الضخمة، يعد اختيار الميزات (Feature Selection) من الأمور البالغة الأهمية، خاصة عندما يتعلق الأمر بالبيانات عالية الأبعاد. ومع ذلك، كانت العديد من خوارزميات اختيار الميزات، وخاصة الأساليب المعتمدة على التغليف (Wrapper Methods)، تواجه عادةً عائقًا كبيرًا يتمثل في كفاءتها المنخفضة عند العمل على منصات تعتمد على وحدة المعالجة المركزية (CPU)، وذلك بسبب التعقيد الشديد في العمليات الحسابية. لذا، جاء الحل الجديد بمقاربة مبتكرة تتضمن تطوير نسختين معززتين باستخدام وحدات معالجة الرسوميات (GPU) لخوارزمية بوروتا (Boruta) لاختيار الميزات.
تعتمد النسخة الأولى، المعروفة باسم Boruta-Permut، على أهمية الميزات المستمدة من التباديل، بينما تستخدم النسخة الثانية، Boruta-TreeImp، مبدأ تقليل عدم النقاء لتحديد أهمية الميزات. تم تقييم فعالية هاتين الطريقتين من خلال إجراء تجارب على مجموعة بيانات تم إنشاؤها ذاتيًا بالإضافة إلى عدة مجموعات بيانات متاحة للجمهور.
أظهرت النتائج التجريبية أن الخوارزميات المعززة بـGPU تُحسن بشكل كبير من كفاءة الحسابات، مع الحفاظ على دقة اختيار الميزات التي تشبه إلى حد كبير تلك الخاصة بخوارزمية بوروتا الأصلية. ومع ذلك، لوحظ أيضاً أن النسخة المعتمدة على تقليل عدم النقاء قد تفرط في تقدير أهمية بعض الميزات.
بشكل عام، تشير هذه النتائج إلى أن تنفيذ عملية اختيار الميزاتBoruta على وحدات معالجة الرسوميات يمثل حلاً فعالًا من حيث التكلفة لتحليل البيانات الكبيرة، مما يعد إنجازًا كبيرًا في هذا المجال.
تقنية مثيرة: خوارزميات بوروتا المعززة بـGPU لاختيار الميزات من بيانات عالية الأبعاد
تقدم دراسة جديدة خوارزميات بوروتا المعززة بوحدات معالجة الرسوميات (GPU) لاختيار الميزات، مما يزيد من كفاءة المعالجة بشكل ملحوظ. تظهر النتائج أن هذه الخوارزميات ليست فقط أسرع، بل تحتفظ أيضاً بدقة الاختيار.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
