في زمن الذكاء الاصطناعي، أصبحت نماذج اللغة الكبيرة متعددة الوسائط (MLLMs) أداة محورية في التعامل مع المعلومات. تُواجه هذه النماذج تحديًا رئيسيًا يتمثل في تحديث المعرفة بشكل فعال دون التأثير على قدراتها الأساسية. ولتحقيق ذلك، تم تطوير تقنيات جديدة تهدف إلى تحسين موثوقية وعمومية التحديثات.
تشير الأبحاث إلى أن عملية تحرير المعرفة متعددة الوسائط عادةً ما تكون موثوقة في توجيه المعلومات، لكنها تواجه مشكلة كبيرة تتمثل في عدم القدرة على معالجة التعديلات عبر الأنماط المختلفة من المدخلات اللفظية والمرئية. ترجع هذه المشكلة إلى نقص في الإشراف الدلالي الصريح، والنطاقات الصارمة للتعديل، والانحياز إلى عينات معينة في الفضاءات متعددة الوسائط العالية الأبعاد.
للتغلب على هذه التحديات، تم تقديم مفهوم "التعديل المعرفي المتين"، الذي يركز على تحقيق عمومية قوية. يتم صياغة هذا المفهوم من خلال وحدات المعرفة التي تجمع المدخلات متعددة الوسائط المتناسبة دلاليًا. كما تم تعريف العمومية كدقة التنبؤات ضمن كل وحدة.
تظهر الأبحاث أيضًا تقنية "التعديل العدائي الكامن" (Latent Adversarial Robustification-LAR)، التي تنتج متغيرات عدائية ولكن متماسكة دلاليًا في الفضاء الكامن المشترك. بالإضافة إلى ذلك، تم اقتراح تقنية "تعلم الفضاء الفرعي المقيد بالترتيب" (Rank-Constrained Subspace Learning-RCSL)، التي تفرض محاذاة منخفضة الترتيب للتمثيلات العدائية في طبقة التعديل باستخدام هدف قائم على القيم singular.
تشير التحليلات الشاملة إلى فعالية هذه التقنيات الجديدة، مما يجعل تطوير المعرفة في الذكاء الاصطناعي أكثر كفاءة ودقة. هذه الابتكارات تعد خطوة هائلة نحو تحسين كيفية معالجة وتحديث المعلومات المتعددة الوسائط في نظم الذكاء الاصطناعي الحديثة.
ما رأيكم في هذه التطورات الجديدة في مجال الذكاء الاصطناعي؟ شاركونا في التعليقات.
تحديث المعرفة في الذكاء الاصطناعي: التحسينات الثورية لنماذج البيانات متعددة الوسائط
تسلط هذه المقالة الضوء على تقنيات جديدة لتعزيز تحديث المعرفة في نماذج اللغة الكبيرة متعددة الوسائط (MLLMs). حيث تقدم هذه الابتكارات حلاً لمشكلة عدم انتقال التعديلات عبر المتغيرات اللغوية والمرئية المتشابهة.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
