تعد الشبكات العصبية العميقة (Deep Neural Networks) واحدة من أهم الابتكارات في مجال الذكاء الاصطناعي، لكنها غالباً ما تحتوي على وحدات خفية زائدة (Redundant Hidden Units). تعد إزالة الأوزان الفردية أمراً فعالاً في خفض عدد المعلمات، لكن التخفيف غير المنظم (Unstructured Sparsity) قد يواجه صعوبات في التنفيذ باستخدام التركيبات الكثيفة القياسية.
تكشف الدراسة الجديدة عن إطار عمل مبتكر يعتمد على خوارزميات المُقامر المُتعدد (Multi-Armed Bandits) لإزالة الخلايا العصبية بالكامل. في هذا الإطار، يتم اعتبار كل خلية عصبية مرشحة كذراع؛ حيث يعني سحب ذراع ما تظليل تلك الخلية العصبية مؤقتاً، وقياس التغيير في الخسارة على عينة صغيرة، ثم استعادة الخلية العصبية وتحديث تقدير مكافأتها لإزالة آمنة.
يدعم هذا الإطار سياسات عشوائية مثل Epsilon-Greedy وSoftmax وUCB1 وThompson Sampling، بالإضافة إلى سياسات الأوزان المضاعفة مثل أسلوب Hedge وEXP3. تم تقييم الطريقة على مهام التصنيف والرجوع الجدولي، فضلاً عن مهام تتعلق بالتعلم العميق تغطي معالجة الصور والنصوص والتفكير.
من خلال المقارنات الإحصائية باستخدام اختبار Friedman ومن ثم اختبار Nemenyi، تبين وجود اختلافات ملموسة بين الطرق المختلفة. وفي مهام التصنيف الجدولي، سجلت سياسة UCB1 أعلى ترتيب متوسط بين سياسات التخفيف وأظهرت تحسناً على الشبكة العصبية غير المُخففة. وفي مهام الرجوع، حصلت UCB1 على أعلى ترتيب متوسط ونافست أو تفوقت على العديد من نماذج الرجوع القياسية وفقاً لمقياس R^2.
تُظهر نتائج التجربة أن تخفيف الخلايا العصبية القائم على خوارزميات المُقامر المُتعدد هو نهج فعال من حيث القدرة الحاسوبية، ما يتيح تخفيض هيكل النموذج بطريقة عملية جداً. كيف ترى هذا الابتكار في مجال الذكاء الاصطناعي؟ شاركونا آراءكم!
إزالة الخلايا العصبية بتقنية جديدة: كيف تغير خوارزميات المُقامر المُتعدد مستقبل الشبكات العصبية العميقة؟
تقدم الدراسة الجديدة طريقة مبتكرة لإزالة الخلايا العصبية الزائدة من الشبكات العصبية العميقة، مما يعزز كفاءة النموذج بشكل ملحوظ. تستخدم هذه الطريقة تقنية خوارزميات المُقامر المُتعدد التي تُعزز أداء النموذج في مهام متعددة.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
