تتزايد الحاجة لاستخراج المعلومات تلقائياً من الويب مع تزايد كثافة وتنوع المحتوى المتوفر على الإنترنت. يقدم كوسكرايمر (Co-Scraper) حلاً رائعاً لهذه المشكلة، حيث يمكنه تجهيز أدوات استخراج بيانات قابلة لإعادة الاستخدام على صفحات الويب المتشابهة.
يتكون كوسكرايمر من إطار عمل ثنائي المرحلة يتعامل مع التعقيد الهيكلي للوثائق الطويلة المكتوبة بلغة HTML. من خلال دمج آلية تقليم شجرة الهيكلية (DOM Pruning) المعتمدة على الاستعلام مع استراتيجيات استخراج مستقرة، يمكن لكوسكرايمر تحويل المحتوى الويب إلى أطر قابلة للتنفيذ باستخدام نموذج Qwen3-8B المحسن.
وعند اختباره على مجموعة بيانات SWDE، حقق كوسكرايمر أداءً غير مسبوق، حيث سجل نسبة F1 تصل إلى 94.78% ومعدل نجاح إعادة الاستخدام بلغ 90.39%. هذا التأثير الكبير يعزز دقة ومرونة الاستخراج، مما يوفر منهجية فعالة جداً للحصول على البيانات من الويب.
كوسكرايمر: ثورة في استخراج البيانات من الويب بذكاء صناعي متقدم!
يقدم نظام كوسكرايمر (Co-Scraper) إطاراً مبتكراً يغير طريقة استخراج البيانات من الإنترنت. يسهم هذا النظام في تحسين دقة ومرونة العمليات الاستخراجية بشكل كبير.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
