تعد عملية استخراج البيانات الهيكلية من النصوص غير المنظمة باستخدام نماذج اللغات الضخمة (LLMs) من التحديات الكبيرة التي تواجه الباحثين والمطورين. ومع تزايد تعقيد المخططات المستهدفة، يصبح من الصعب التعامل مع البيانات بشكل فعال. في هذا السياق، تقدم تقنية SchemaRAG الجديدة حلاً مبتكرًا يسهم في تحسين هذه العملية.
تعتمد SchemaRAG، وهو إطار عمل على تقنيات استرجاع معززة (Retrieval-Augmented Generation - RAG)، على تقليم فضاء المخطط الناتج ديناميكيًا، مما يسهل مهام استخراج المعلومات المشروطة بالمخطط. تعمل هذه التقنية على الاستفادة من بيانات الميتاداتا الخاصة بالمخطط وأمثلة قليلة لاستخدامها في العملية. في التجارب التي جرت على مجموعات بيانات حقيقية في مجالي الرعاية الصحية والتجارة الإلكترونية، أظهرت SchemaRAG نتائج مثيرة للإعجاب.
فقد حققت زيادة تصل إلى 8.8% في درجة المقياس الدقيق (micro-F1) مع تقليل زمن الانتظار بنسبة 47% وتقليص التكاليف بنسبة 48%. هذه الأرقام تبرز فعالية SchemaRAG كحل عملي لاستخراج البيانات من المخططات الكبيرة، مما يمثل خطوة جديدة نحو تحسين الكفاءة والتوفير في التكاليف في هذا المجال المتطور.
اكتشف كيف تعيد SchemaRAG تشكيل استخراج البيانات: ثورة في معالجة المعلومات المعقدة!
تقدم تقنية SchemaRAG الجديدة إطار عمل يلبي تحديات استخراج البيانات من النصوص غير المنظمة باستخدام نماذج اللغات الضخمة (LLMs)، مما يحقق زيادة ملحوظة في الكفاءة. نتائج البحث تظهر تحسناً كبيراً في الأداء وتقليل التكاليف.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
