إطلاق قاعدة بيانات جديدة لتصنيف اللغة المجازية: SiNFluD للأدب السندهي

Q: ما هو موضوع مقال "إطلاق قاعدة بيانات جديدة لتصنيف اللغة المجازية: SiNFluD للأدب السندهي"؟

يتناول المقال بالتفصيل والتحليل آخر الأخبار والتطورات المتعلقة بـ "إطلاق قاعدة بيانات جديدة لتصنيف اللغة المجازية: SiNFluD للأدب السندهي" في عالم الذكاء الاصطناعي والتكنولوجيا الناشئة.

في خطوة جديدة تعزز من أبحاث الذكاء الاصطناعي، تم تقديم قاعدة بيانات SiNFluD، وهي بنية بيانات مبتكرة تمحورت حول تصنيف اللغة المجازية (figurative language) في الأدب السندهي. تمثل هذه المجموعة ثمرة جهود لجمع نصوص أدبية ومنشورات عبر المدونات ووسائل التواصل الاجتماعي، حيث تم إعدادها بعناية لتكون جاهزة للتعليق والتصنيف.

اجتمع فريق من اثنين من المعلقين الأصليين للغة السندية ليقوموا بعملية تصنيف البيانات باستخدام أداة التعليق النصي Doccano، حيث وصلوا إلى توافق بين المعلقين بنسبة 0.81، مما يعكس دقة وجودة العمل المنجز.

عقب ذلك، تم إعداد نتائج أساسية باستخدام تقنيات التحقق المتقاطع (cross-validation) بخمسة وعشرة طيات. وقد تم تقييم نماذج متعددة مثل mBERT وXLM-RoBERTa، إلى جانب نموذج XLM-RoBERTa-XL. فيما تم تطبيق تقنية SetFit دقيقة للنماذج ذات الأداء الجيد في تعلم العبارات.

من خلال هذه التجربة، استطاع نموذج XLM-RoBERTa-XL المدرب مسبقاً تحقيق أفضل أداء بين جميع النماذج المختبرة، مما يؤكد على قوة التقنيات الحديثة في تحليل وتصنيف النصوص الأدبية.

إن هذا المشروع لا يمثل مجرد خطوة في مسيرة الأبحاث الأكاديمية، بل هو بوابة جديدة لفهم الثقافة واللغة السنديه بطرق فريدة. نحن متشوقون لرؤية كيف ستسهم هذه القاعدة في إثراء الدراسات المستقبلية. ما رأيكم في دور الذكاء الاصطناعي في دعم اللغات الأقل شهرة؟ شاركونا آرائكم!

إطلاق قاعدة بيانات جديدة لتصنيف اللغة المجازية: SiNFluD للأدب السندهي

شارك الخبر مع أصدقائك

📰أخبار قد تهمك

ثورة جديدة في عالم البرمجة: شركة Gitar الناشئة تؤمن الكود باستخدام الذكاء الاصطناعي!

جوجل تطلق ميزة الذكاء الشخصي جيمني في الهند: تجربة مخصصة في متناول يدك!

أوبن أيه آي تستحوذ على شركة هيرو لتكنولوجيا التمويل الشخصي: خطوة نحو التخطيط المالي الذكي!