تعتبر نماذج اللغات الضخمة (Large Language Models) من أبرز التقنيات الحديثة في مجال الذكاء الاصطناعي، وتحقق أداءً مدهشًا في العديد من المهام. ولكن، لا تزال هذه النماذج عرضة لمشكلة "الأخطاء المرجعية"، وخاصة عند التوليد الطويل للمحتوى. تتسبب السياقات المسترجعة الزائدة وسلاسل التفكير الطويلة في تفاقم هذه الأخطاء، مما يعكس عدم دقة في المعلومات المقدمة.
أظهرت دراسات حديثة ظاهرة مثيرة للاهتمام: كلما اقتربت المعلومات الرئيسية من مخرجات النموذج، زادت دقتها. ومع ذلك، تفتقر النماذج المعززة بالاسترجاع (Retrieval-Augmented Language Models) إلى آليات فعالة لضمان هذه القرب، حيث تتم إضافة الأدلة الخارجية خلال عمليات استرجاع متعددة، ولكن هذا لا يضمن بقاء المعلومات المهمة بالقرب من المخرجات.
ولحل هذه الإشكالية، نقدم تقنية Micro-Macro Retrieval (M2R)، وهي إطار عمل مبتكر يجمع بين الاسترجاع أثناء التوليد. على المستوى الكلي، تسترجع M2R أدلة مشتتة من مصادر خارجية؛ وعلى المستوى الدقيق، تستخرج نتائج أساسية من مستودع المعلومات الرئيسي الذي تم بناؤه خلال عملية التفكير وإعادة استخدامها أثناء توليد الإجابات.
تصميم هذه التقنية يتعامل بشكل مباشر مع مشكلة قرب المعلومات الأساسية من المخرجات، مما يؤدي إلى تقليل الأخطاء بشكل فعّال في المهام الطويلة. تم تدريب نظام M2R باستخدام استراتيجية تعلم مدرسي تعتمد على التعزيز مع مكافآت قاعدية مخصصة، مما يمكنه من اكتساب مهارات الاسترجاع والتأسيس بشكل مستقر.
تجارب موسعة عبر معايير مختلفة تثبت فعالية نظام M2R، خاصة في سيناريوهات السياقات الطويلة. إن M2R لا يسهم فقط في تحسين دقة المعلومات، ولكنه أيضًا يمثل خطوة كبيرة نحو تحسين أداء نماذج اللغة بشكل عام.
تقنية Micro-Macro Retrieval: كيفية تقليل أخطاء الأشكال الطويلة في نماذج اللغات الضخمة!
تقدم تقنية Micro-Macro Retrieval حلاً مبتكرًا لمشكلة الأخطاء المرجعية الطويلة في نماذج اللغات الضخمة. بفضل نظام استرجاع ذكي، تزداد دقة المعلومات المتولدة من قبل النماذج بشكل ملحوظ.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
