في عالم الذكاء الاصطناعي، تُعتبر نماذج اللغة الضخمة (Large Language Models) عنصراً أساسياً في معالجة اللغات الطبيعية. ومع ذلك، كانت التقييمات الحالية تعتمد على خوارزميات بسيطة تعاني من "عمى معرفي"، مما يجعل من الصعب التمييز بين استخراج المعلومات السياقية الحقيقية واسترجاع ذاكرات بارامترية. في محاولة للتغلب على هذه التحديات، تم تقديم مقياس جديد يُعرف باسم "استخدام السياق المنظم" (Normalized Context Utilization) والذي يستند إلى تحليل الاحتمالات اللوجستية المستمرة across البيئات المختلفة.
تستعرض الدراسة الجديدة، التي تم نشرها على منصة arXiv، مجموعة من النماذج تغطي النطاق من 1.5 مليار إلى 72 مليار بارامتر. وظهر أن تحقيق استخراج دقيق للمعلومات، دون الاعتماد على التفكير المنهجي، يُظهر أن النماذج الصغيرة (Small Language Models) يمكن أن تتفوق أو تنافس النماذج الكبيرة. يعود ذلك إلى عدم فعالية القوانين التقليدية التي تتعلق بتوسيع النماذج، والتي تظهر عوائد متناقصة بشكل ملحوظ.
علاوة على ذلك، تسلط هذه الدراسة الضوء على ما يُعرف بـ "هيمنة السابق" (Prior Dominance) التي ترتبط بتوسع النموذج والتوافق الرياضي الخاص.
تُظهر الأبحاث أن أحد التطبيقات التجارية المُختبرة لم يتمكن من استخدام الأدلة الخارجية بشكل فعال في حوالي نصف النزاعات، بل وواجه انهياراً ثقة نظامياً عندما تناقضت مبادئه البارامترية. تبرز هذه النتائج مزايا للهيكل المعرفي وأفضل الالتزام السياقي للنماذج الصغيرة في سياقات استخراج المعلومات.
ثورة في نماذج الذكاء الاصطناعي: قياس الهيمنة السابقة في أنظمة RAG
تقدم دراسة جديدة مقياسًا مبتكرًا يُعرف باسم "استخدام السياق المنظم" (Normalized Context Utilization) لتحسين تقييم نماذج توليد النصوص المعززة بالاسترجاع. تكشف النتائج أن نماذج اللغة الصغيرة قد تتفوق على النماذج الكبيرة في استخراج المعلومات الدقيقة.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
