في عالم تكنولوجيا الذكاء الاصطناعي، يبرز إطار RecGOAT كحل مبتكر لتحديات التوصيات متعددة الوسائط (multimodal recommendation). فقد أظهرت الدراسات أن دمج تمثيلات النماذج اللغوية الكبيرة (Large Language Models) يمكن أن يحدث ثورة في أداء أنظمة التوصية، لكن تبقى هناك مشكلة رئيسية لم يتم تناولها بشكل كافٍ: التباين الدلالي بين تمثيلات النماذج اللغوية والإشارات التعاونية المعتمدة على المعرفات التي تعتمد عليها أنظمة التوصية.

قد يؤدي إدخال ميزات النماذج اللغوية بطريقة عشوائية دون محاذاة مناسبة إلى تدهور أداء التوصيات بدلاً من تحسينه. لذلك، يأتي RecGOAT ليقدم إطاراً مبتكراً يستند إلى الشبكات العصبية الرسومية ونظرية النقل الأمثل. يعمل هذا الإطار أولاً على إثراء دلالات التعاون من خلال استخدام الرسوم البيانية متعددة الوسائط، التي تلتقط العلاقات بين العناصر (item-item)، والمستخدمين (user-item)، والمستخدمين (user-user)، حيث يستهل تمثيلات المستخدم استناداً إلى التفضيلات السلوكية المستنتجة من النماذج اللغوية.

ثم يتم محاذاة تمثيلات النماذج اللغوية مع معرفات التوصية على مستويين مكملين: الأول هو المحاذاة على مستوى الحالة عبر التعلم التبايني بين الأنماط المختلفة (cross-modal contrastive learning) لإنتاج تمثيلات تمييزية لكل عينة؛ والثاني هو المحاذاة على مستوى التوزيع باستخدام النقل الأمثل التكيفي (optimal adaptive transport) الذي يقلل المسافة بمقياس Wasserstein بين التوزيعات المعرفية ودلالات النماذج اللغوية، مما ينتج مساحة ميزات متسقة وموحدة.

أظهرت التجارب الواسعة على ثلاثة معايير عامة أن RecGOAT يحقق أداءً رائدًا في المجال، كما أثبت تكامله في منصات الإعلان الكبيرة عبر الإنترنت كفاءة عالية. لمزيد من التفاصيل، يمكنكم زيارة رابط الكود.

ما رأيكم في هذه الابتكارات الجديدة في عالم الذكاء الاصطناعي؟ نشجعكم على مشاركتنا آراءكم في التعليقات!