في عصر [المعلومات](/tag/المعلومات) الحديث، تواجه [منصات [التواصل](/tag/التواصل) الاجتماعي](/tag/[منصات](/tag/منصات)-[التواصل](/tag/التواصل)-الاجتماعي) [تحديات](/tag/تحديات) كبيرة عند التعامل مع المحتوى المتعدد الوسائط. قد تحتوي المنشورات على [صور متعددة](/tag/[صور](/tag/صور)-متعددة) تتعلق بالنص بشكل ضعيف أو تكون مكررة، مما يجعل مهمة استخراج [المعلومات](/tag/المعلومات) معقدة وصعبة. في هذا السياق، يمكن أن يؤدي [الدمج](/tag/الدمج) المستمر لمعلومات [متعددة الوسائط](/tag/متعددة-الوسائط) إلى إهدار الموارد وتعزيز الإشارات المرئية غير الدقيقة.
لتجاوز هذه العقبات، تم تقديم إطار [SAVER](/tag/saver) (Selective As-Needed Vision Evidence) الذي يتيح استخراج الأساليب [متعددة الوسائط](/tag/متعددة-الوسائط) (Multimodal Information Extraction) بشكل انتقائي وفعّال. يعتمد [SAVER](/tag/saver) على [تقنية](/tag/تقنية) تُدعى بوابة [التحقق](/tag/التحقق) المتوافقة (Conformal Groundability Gate - CGG) التي تساعد في تقدير [مصداقية](/tag/مصداقية) [الرؤية](/tag/الرؤية) على مستوى كل جزء أو كيان مُحدد.
يجمع [SAVER](/tag/saver) بين مجموعة من [الصور](/tag/الصور) ويختار من بينها مجموعة فرعية موثوقة تُستخدم كأدلة عند الحاجة، مما يجعل العمليات أكثر [دقة](/tag/دقة) وفاعلية. كما يطبق الإطار [خوارزمية](/tag/خوارزمية) مشتركة لتقييم مدى [توافق](/tag/توافق) النص مع [الصور](/tag/الصور) المستخدمة، مما يعزز [دقة](/tag/دقة) [التصنيف](/tag/التصنيف) للكيانات والعلاقات.
تشير [التجارب](/tag/التجارب) التي تم إجراؤها على [SAVER](/tag/saver) إلى أنه يُحسن باستمرار من [أداء](/tag/أداء) القياسات، حيث يتفوق على الأساليب التقليدية التي تعتمد على النص فقط. كما يُظهر [SAVER](/tag/saver) تقليلًا في حجم العمليات الحسابية (FLOPs) وزيادة تغطية التنشيط عند مستوى الخطر الثابت، مما يجعله خيارًا مناسبًا للأبحاث المستقبلية في هذا المجال.
ابتكار SAVER: إطار رؤي انتقائي لتحسين استخراج المعلومات متعددة الوسائط
يتيح إطار SAVER استخراج المعلومات متعددة الوسائط بطريقة فعالة وغير مضيعة للموارد من خلال تقديم رؤية انتقائية. بفضل تقنيات متقدمة، يتجاوز SAVER طرق التعلم التقليدية ليحقق نتائج متميزة.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
