في عالم الألعاب التفاعلية، يُعد إنشاء تجربة غامرة وفريدة سواء عبر الواقع الافتراضي (VR) أو السرد التفاعلي خيارًا أساسيًا. لكن، كيف نضمن أن تعكس تفاعلات الشخصيات جوهر القصة والمشاهد بشكل دقيق؟ هنا يأتي دور نموذج التعلم المعزز المنفصل EBM-RL (Eye-Brain-Mouth Reinforcement Learning).

تستند فكرة النموذج إلى محاكاة العملية البشرية الطبيعية "رؤية - تفكير - تحدث"، مما يتيح للنموذج فهم المشاهد أولاً ثم بناء الحوار. إذًا، كيف يتم ذلك؟ يتم فصل المراحل الثلاث لتطوير الحوار: الرؤية، والتفكير، وتوليد الكلام. يتكامل النموذج مع مكافآت متعلقة بتوافق النص مع المشهد، وفائدة الإدراك والتفكير، وإخلاص الإجابة، وتجانس التنسيق.

تظهر التجارب أن EBM-RL يحقق نتائج متفوقة مقارنة بالنماذج التقليدية التي تعتمد فقط على النص، بل ويتفوق أيضاً على نماذج أكبر مرتبطة بالرؤية واللغة. كما أن النموذج أظهر قدرة قوية على الانتقال دون تعديل إضافي إلى بنوك بيانات أسئلة وأجوبة تركز على الفيديو.

مع إطلاق مجموعة بيانات مفتوحة المصدر للحوار المبني على الفيديو، يبدو أن مستقبل الألعاب التفاعلية بات أقرب إلى تحقيق مستويات جديدة من الانغماس والتفاعل.