في ظل النمو المتسارع وتعقيد بيانات المنتجات في مشهد التجارة الإلكترونية البرازيلية الديناميكي، تبرز الحاجة إلى أساليب قوية ومتخصصة لاستخراج المعلومات بشكل منظم. تعاني الطرق التقليدية لاستخراج قيم صفات المنتجات (Product Attribute Value Extraction - PAVE) من التعقيدات اللغوية والاختلافات الكبيرة في أوصاف المنتجات باللغة البرتغالية.
لتلبية هذه الحاجة الملحة، قدمت دراسة حديثة نظام AI-PAVE-Br، وهو نظام متخصص مصمم باستخدام نماذج لغوية ضخمة (Large Language Models - LLMs) لتحقيق دقة عالية في استخراج بيانات الصفات للكتالوجات التجارية البرازيلية.
إضافةً إلى ذلك، ولتسهيل البحث القابل للتكرار وتوفير معيار موحد، قام الباحثون بتقديم مجموعة بيانات جديدة تُعرف بـ "Golden Set"، والتي تم جمعها بعناية وتدوينها يدوياً لاستخدامها في عمليات PAVE باللغة البرتغالية. ومن خلال تفصيل عملية الإنشاء والبنية الخاصة بمجموعة البيانات هذه (مثل الكيانات، الفئات، والفئات الفرعية) ، قدمت الدراسة إطاراً مرجعياً عالي الجودة.
أظهرت التجارب بشكل قاطع أن نظام AI-PAVE-Br يتفوق بشكل كبير على الأطر السابقة لاستخراج الكيانات المُسماة (Named Entity Recognition - NER) بفضل استراتيجيات هندسة الطلب المستهدفة، مما يوفر حلاً متميزاً وقابل للتوسع لواحد من أكبر الأسواق غير الناطقة بالإنجليزية. كما يثري هذا البحث مجتمع معالجة اللغة الطبيعية (NLP) بموارد قيمة متاحة للجمهور من أجل الأبحاث المستقبلية في مجال استخراج بيانات الصفات.
ثورة في استخراج بيانات المنتجات: AI-PAVE-Br يستخدم نماذج لغوية ضخمة لتجاوز الصعوبات في السوق الإلكترونية البرازيلية!
تقدم دراسة حديثة نظام AI-PAVE-Br الذي يعتمد على نماذج لغوية ضخمة لتحسين استخراج قيم صفات المنتجات في التجارة الإلكترونية البرازيلية. هذا النظام يعالج التحديات اللغوية ويعد بمثابة مرجع للبحث في هذا المجال.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
