في عالم الذكاء الاصطناعي، تُعتبر الإجابة على الأسئلة المستندة إلى الصور أحد التحديات المعقدة بسبب النزاعات المعرفية الشديدة التي تنشأ نتيجة لقيود الاسترجاع في المجالات المفتوحة. تقدم الدراسات السابقة أساليب محدودة في التعامل مع هذه النزاعات، مما يؤثر سلبًا على دقة النتائج.
لذلك، يبتكر الباحثون إطار عمل جديد يُعرف باسم REAL (أي محاذاة التفكير المحوري)، والذي يركز على مفهوم مبتكر يُسمى "محور التفكير" (Reasoning-Pivot). هذا المحور هو وحدة أساسية في سلسلة التفكير، تُبرز رابط المعرفة وتعتمد في كثير من الأحيان على الأدلة الخارجية لإكمال عملية التفكير.
بفضل مجموعة بيانات REAL-VQA التي تم إنشاؤها، يدمج هذا الإطار أسلوب تعلم ذكي يُعرف بـ "التدريب الذكي على محور التفكير" (Reasoning-Pivot Aware SFT) الذي يُساعد في تدريب مُميز عام من خلال محاذاة النزاعات مع استخراج المحاور. كما يستخدم هذه المحاور لاستراتيجيات فك الشيفرة الداخلية المعروفة بـ "فك الشيفرة الموجهة بواسطة محور التفكير" (Reasoning-Pivot Guided Decoding) لتخفيف النزاعات المستهدفة.
أظهرت التجارب الواسعة على مجموعات بيانات متنوعة أن إطار REAL يُعزز بشكل ملحوظ دقة التمييز ويحقق أداءً فائقًا، مما يُثبت فعالية هذا النهج القائم على المحاور لحل النزاعات.
سينعكس هذا التقدم المهم في تحسين الإجابات على الأسئلة المعقدة وقد يفتح آفاقًا جديدة في مجال الذكاء الاصطناعي وتطبيقاته المختلفة.
حققوا تقدمًا مذهلاً: إطار REAL لحل نزاعات المعرفة في أسئلة الصور المعقدة!
تمكن الباحثون من تقديم إطار عمل مبتكر يُعرف باسم REAL لحل نزاعات المعرفة في مجال أسئلة الصور المعقدة. يسعى هذا الإطار إلى تعزيز دقة الإجابة من خلال ربط المعلومات وتفادي تناقضات المعرفة.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
