في عالم الذكاء الاصطناعي، تعتبر نماذج اللغات الضخمة (Large Language Models) أداة حيوية لإنتاج نصوص معززة بالمعرفة المسترجعة (Retrieval-Augmented Generation). ولكن، يواجه هذا النوع من الأنظمة تحديات جمة تتعلق بالصراعات التي قد تظهر بين السياق المسترجع والمعرفة البرمجية المستندة إلى النموذج. تمثل هذه الصراعات عائقًا كبيرًا أمام تحسين أداء النماذج، لذلك عملت العديد من الدراسات على معالجة هذه القضية عبر تعديل الخلايا العصبية المرتبطة بالمعرفة.

ولكن، هذه المقاربات قد تؤدي إلى آثار جانبية غير متوقعة تؤثر سلبًا على قدرات النماذج الشاملة، بسبب تعقيد تفاعل الخلايا العصبية. وهنا يأتي دور SHIFT، الإطار الجديد الذي يعيد صياغة استراتيجيات تعديل الخلايا العصبية عن طريق تنظيم قابل للتعلم في شكل بوابات.

يقدم SHIFT نموذجًا مبتكرًا يمكن نماذج اللغات الضخمة من تنظيم تنشيطاتها الداخلية بشكل ديناميكي لحل صراعات المعرفة. تقنية SHIFT تعتمد على وحدة بوابة خفيفة الوزن وتعدل أقل من 0.01% من المعلمات قابلة للتدريب دون تغيير الهيكل الأساسي للنموذج. خلال عملية التوليد، تقوم وحدة البوابة بتعديل التمثيلات الداخلية للنموذج للاستفادة بشكل أفضل من المعرفة السياقية والمعرفة البرمجية.

وأظهرت التجارب المكثفة عبر ستة مجموعات بيانات قوة فعالية SHIFT مقارنة بالأساليب المنافسة المختلفة. المعلومات والأكواد الخاصة بالمشروع متاحة على GitHub. هذا الإنجاز يمثل خطوة كبيرة نحو تحسين قدرة نماذج الذكاء الاصطناعي على الاستفادة من البيانات الخارجية في توليد النصوص. ما رأيكم في هذا التطور المذهل؟ شاركونا في التعليقات.