في عصر تزايد المعلومات والنصوص التي ينتجها المستخدمون عبر المنصات الرقمية، أصبح من الضروري تطوير نماذج قابلة للتفسير قادرة على تصنيف النصوص بدقة ووضوح. قدم فريق البحث نظام ProtoSiTex كقاعدة ثورية لتصنيف النصوص متعددة التسميات (Multi-label Text Classification).
يتميز هذا النظام بآلية تدريب ثنائية المراحل، حيث تبدأ المرحلة الأولى باكتشاف نماذج أولية (Prototypes) بطريقة غير خاضعة للإشراف، مما يعكس تنوعًا وتماسكًا دلاليًا. يليها مرحلة التصنيف الخاضع للإشراف، والتي توفر ربطًا منطقيًا بين هذه النماذج الأولية وملصقات الفئات.
بفضل وجود دالة خسارة هرمية تعزز التناسق على مختلف مستويات النص (من الجمل والفقرات إلى الوثائق الكاملة)، يحقق ProtoSiTex توازنًا مثاليًا بين الدقة وقابلية الفهم.
من ميزات هذا النظام أيضًا قدرته على التقاط الدلالات المتداخلة والمتعارضة عبر الاعتماد على نماذج أولية قابلة للتكيف (Adaptive Prototypes) وتقنيات الانتباه المتعدد الرأس (Multi-head Attention). كما تضمن البحث تقديم مجموعة بيانات مرجعية تتضمن تقييمات فنادق مشروطة على مستوى الفقرات، مما يتيح إجراء تجارب دقيقة.
تُظهر النتائج التي تم الحصول عليها من التجارب على هذه المجموعة واثنين من المعايير العامة (Binary وMulti-class) أن ProtoSiTex يحقق أداءً رائدًا، مما يرسخ مكانته كحل موثوق للتصنيف النصي متعدد التسميات مع تفسيرات واضحة تتماشى مع الفهم البشري.
ثورة ProtoSiTex: النظام الثوري لتصنيف النصوص متعددة التسميات!
تقدم ProtoSiTex إطار عمل مبتكر لتصنيف النصوص متعددة التسميات، مع تركيز على قابلية الفهم والتفسير. تعكس نتائج أبحاثنا الأداء المتميز لهذا النظام، مما يجعله حلاً موثوقًا في عالم الذكاء الاصطناعي.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←# البحث# تصنيف النصوص# التعلم الآلي# نموذج ProtoSiTex# تحليل البيانات# الذكاء الاصطناعي# خوارزميات التعلم
جاري تحميل التفاعلات...
