في عالم العلم، تعتبر قواعد بيانات خصائص المواد من الموارد الحيوية، ولكن مع وجود غالبية البيانات الكمية المبلغ عنها حصريًا في الأشكال العلمية، كانت التحديات قائمة في استخراج هذه المعلومات. هنا يأتي دور ComProScanner، الذي أُدخل عليه مؤخرًا دمج نموذج الرؤية واللغة (VLM) بهدف تحسين دقة استخراج بيانات المواد.
هذا النظام المتكامل، المعروف بقدرته على العمل كإطار عمل متعدد الوكلاء، يتيح الآن القدرة على استخراج المعلومات من الأشكال العلمية بجودة غير مسبوقة. فقد أُضيف إليه أداة FigureExtractor، التي تقوم بفرز الأشكال بناءً على الكلمات الرئيسية والتعليقات التوضيحية. كما تم إدخال أداة GraphExtractorTool التي تعمل على تمرير الأشكال المستخرجة إلى نموذج VLM يمكن تكوينه، بهدف استعادة أزواج التركيب-الخاصية من المخططات والرسوم البيانية العلمية.
أثبتت الاختبارات التي أُجريت على 50 مقالة متعلقة بالخزف الكهروإجهاد (piezoelectric ceramic) أن نموذج Gemini-3-Flash-Preview حقق أعلى أداء بدقة تركيب بلغت 0.97 ودرجة F1 معيارية تبلغ 0.97 أيضاً، مما يجعله الخيار الأكثر فعالية من حيث التكلفة من بين النماذج الأربعة التي تم تقييمها.
بالإضافة إلى ذلك، تم إدخال معلمة عتبة خطأ القيم المستندة إلى النطاق إلى إطار التقييم، مما يوفر تقييمًا أكثر معنىً جسديًا للقيم العددية المستخرجة من الأشكال مقارنةً بالمطابقة الدقيقة للقيم.
تمثل هذه المساهمات تعبيرًا عن دمج ComProScanner مع نماذج VLM كنقطة انطلاق نحو إنشاء منصة لاستخراج البيانات من الأدبيات العلمية بشكل آلي تمامًا، قادرة على استخراج البيانات الهيكلية من النصوص والجداول والأشكال في مسار موحد، مما يُعزز من فعالية البحث العلمي ويعطيه بُعدًا جديدًا.
ثورة في استخراج بيانات المواد: دمج نموذج الرؤية واللغة في ComProScanner
نجح فريق البحث في دمج نموذج الرؤية واللغة (VLM) ضمن ComProScanner، مما يمثل نقطة تحول في استخراج البيانات من الأشكال العلمية بدقة عالية. هذا التطور يسهم في تحسين بناء قواعد بيانات خصائص المواد بشكل غير مسبوق.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
