لقد شهدنا تقدمًا مذهلاً في نماذج اللغات المرئية الكبرى (Large Vision-Language Models) والتي أضافت أبعادًا جديدة لفهم البيانات متعددة الوسائط. ومع ذلك، لا تزال موثوقيتها متأثرة بمشكلة الأوهام (hallucination)، حيث تتعارض المحتويات المولدة مع الحقائق البصرية. في إطار سعي العلماء لتحسين هذه النماذج، طرحت مجموعة من التقنيات التي تعتمد إما على تدخلات خارجية مكلفة مثل ضبط التعليم (instruction tuning) أو أدوات داخلية تعاني من أوزان انتباه معيبة وتمثيلات مخفية متشابكة.

هنا يأتي دور تقنية التفكيك العدائي العمودي (Adversarial Orthogonal Disentanglement - AOD)، التي تمثل إطارًا هندسيًا حديثًا لمكافحة أوهام LVLMs. تعتمد AOD على هدف مضاد (minimax) حيث يركز مصنّف على إشارات الأوهام في مكون موجه، بينما يسعى معارض إلى إزالتها من مساحة البقايا العمودية باستخدام طبقة عكس التدرجات (Gradient Reversal Layer). هذه الاتجاهات المكتسبة تدعم استراتيجية ترميز متقابل تعتمد على تمرير مزدوج للأمام، مما يقلل من الأوهام مع الحفاظ على القدرة العامة للنموذج.

تجاربنا على ثلاثة نماذج LVLMs عبر أربعة معايير للأوهام وأربعة معايير مفيدة أظهرت أن AOD تتفوق باستمرار على الأساليب التقليدية القوية. حيث حسّنت دقة POPE بأكثر من 6% في المتوسط، وزادت من AMBER بنسبة 6%، بينما حافظت على أداء قوي في المهام المفيدة مثل MMMU. التحليل الإضافي أظهر نقلًا قويًا عبر مجموعات البيانات، مما يشير إلى أن AOD تلتقط انحيازات مرتبطة بالأوهام العامة بدلاً من كونها عيوب محددة المجموعة.

فإذا كنت مهتمًا بتفاصيل أكثر حول هذه التقنية الجديدة ودورها المحتمل في تعزيز موثوقية الذكاء الاصطناعي، يمكنك زيارة GitHub للحصول على الشيفرة المصدرية ومجموعات البيانات.