في عالم الذكاء الاصطناعي، تعتبر خوارزميات التعلم النشط (Active Learning) من الأدوات الأساسية لتقليل الجهد البشري في عملية تصنيف البيانات. حيث تقوم هذه الخوارزميات بتحديد العيّنات الأكثر فائدة من كميات ضخمة من البيانات غير المصنفة، مما يسهم في تحسين فعالية نماذج التعلم الآلي (Machine Learning Models).
ومع ذلك، يعتمد معظم الأبحاث على افتراض أن مصادر التسمية (Labeling Oracles) دائمًا ما تقدم إجابات صحيحة، وهي فرضية قد لا تنطبق في التطبيقات الواقعية. وبناءً على ذلك، بُذل جهد كبير لتطوير خوارزميات التعلم النشط التي تأخذ في الحسبان وجود مصادر تسمية غير دقيقة أو مشوشة.
في هذه الدراسة، قام الباحثون بجمع تسميات لعينات نصية من خلال منصة جماعية مستخدمين ثلاثة مجموعات بيانات مرجعية لتصنيف النصوص. وتضمنت التجارب دراسة ثمانية تقنيات شائعة للتعلم النشط بالتعاون مع شبكات عصبية عميقة، مما يمكنهم من فهم الأداء الحقيقي لهذه التقنيات تحت ظروف تحديات العالم الواقعي.
تظهر النتائج أن المعلّقين يعتبرون قد يقدمون تسميات غير صحيحة أو قد يرفضون تقديم التسمية بالأساس. لذا، يعد هذا البحث خطوة مهمة نحو تطوير أنظمة التعلم العميق النشطة التي يمكن الاعتماد عليها في التطبيقات الحقيقية. وللذين يرغبون في استكشاف التسميات التي تم جمعها، فإن الموارد متاحة عبر الرابط [رابط هنا].
تحليل خوارزميات التعلم النشط: استخدام البيانات النصية المجمعة من الواقع
تقدم هذه الورقة بحثًا متعمقًا حول خوارزميات التعلم النشط وكيف يمكن استخدامها بفعالية مع بيانات نصية تم جمعها من منصة جماعية. يستعرض البحث التحديات الحقيقية التي تواجهها خوارزميات التعلم النشط عند التعامل مع تسميات غير دقيقة.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
