في عالم الذكاء الاصطناعي، تعتبر نماذج اللغات الضخمة (Large Language Models) أداة حيوية لإنتاج نصوص معززة بالمعرفة المسترجعة (Retrieval-Augmented Generation). ولكن، يواجه هذا النوع من الأنظمة تحديات جمة تتعلق بالصراعات التي قد تظهر بين السياق المسترجع والمعرفة البرمجية المستندة إلى النموذج. تمثل هذه الصراعات عائقًا كبيرًا أمام تحسين أداء النماذج، لذلك عملت العديد من الدراسات على معالجة هذه القضية عبر تعديل الخلايا العصبية المرتبطة بالمعرفة.
ولكن، هذه المقاربات قد تؤدي إلى آثار جانبية غير متوقعة تؤثر سلبًا على قدرات النماذج الشاملة، بسبب تعقيد تفاعل الخلايا العصبية. وهنا يأتي دور SHIFT، الإطار الجديد الذي يعيد صياغة استراتيجيات تعديل الخلايا العصبية عن طريق تنظيم قابل للتعلم في شكل بوابات.
يقدم SHIFT نموذجًا مبتكرًا يمكن نماذج اللغات الضخمة من تنظيم تنشيطاتها الداخلية بشكل ديناميكي لحل صراعات المعرفة. تقنية SHIFT تعتمد على وحدة بوابة خفيفة الوزن وتعدل أقل من 0.01% من المعلمات قابلة للتدريب دون تغيير الهيكل الأساسي للنموذج. خلال عملية التوليد، تقوم وحدة البوابة بتعديل التمثيلات الداخلية للنموذج للاستفادة بشكل أفضل من المعرفة السياقية والمعرفة البرمجية.
وأظهرت التجارب المكثفة عبر ستة مجموعات بيانات قوة فعالية SHIFT مقارنة بالأساليب المنافسة المختلفة. المعلومات والأكواد الخاصة بالمشروع متاحة على GitHub. هذا الإنجاز يمثل خطوة كبيرة نحو تحسين قدرة نماذج الذكاء الاصطناعي على الاستفادة من البيانات الخارجية في توليد النصوص. ما رأيكم في هذا التطور المذهل؟ شاركونا في التعليقات.
اكتشاف SHIFT: إطار مبتكر لحل صراعات المعرفة في توليد الاستجابات المعززة بالاسترجاع
تمكن إطار SHIFT من إعادة صياغة التعديلات على المستوى العصبي باعتبارها تنظيم بوابة قابلة للتعلم، مما يساعد نماذج اللغات الضخمة على تجاوز صراعات المعرفة بشكل فعال. تتضمن الأبحاث تجارب موسعة تشير إلى فعالية هذا الإطار الجديد.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
