تشير [الأبحاث الحديثة](/tag/[الأبحاث](/tag/الأبحاث)-الحديثة) إلى أن هناك علاقة مثيرة بين حجم [نماذج [اللغات](/tag/اللغات) الضخمة](/tag/[نماذج](/tag/نماذج)-[اللغات](/tag/اللغات)-الضخمة) (Large Language [Models](/tag/models)) وتواتر الموضوعات في [بيانات](/tag/بيانات) التدريب، وما لذلك من تأثير كبير على جودة [استرجاع](/tag/استرجاع) الحقائق. في إطار [دراسة](/tag/دراسة) تناولت 38 نموذجاً، تم إعدادهم على أكثر من 8900 مرجع أكاديمي باستخدام [نظام تحقق](/tag/نظام-[تحقق](/tag/تحقق)) مرجعي تلقائي، أظهرت النتائج أن جودة الاسترجاع [تتبع](/tag/تتبع) نمطًا غير خطي يتناسب مع [عدد](/tag/عدد) معلمات النموذج وتمثيل الموضوعات في [البيانات](/tag/البيانات) التدريبية.
وفي التفاصيل، [تمكن](/tag/تمكن) الباحثون من [تفسير](/tag/تفسير) 60% من تباين [الأداء](/tag/الأداء) بين 16 نموذجًا كثيفًا من أربع عوائل مختلفة بناءً على هذين العاملين. وبالتركيز على العوائل الفردية، تزايدت هذه النسبة إلى ما بين 74% و94%.
تظهر [الدراسة](/tag/الدراسة) أن [قوة](/tag/قوة) الإشارة ترتبط بتواتر المفاهيم في البيانات، بينما يُحدد مستوى الضجيج بقدرة النموذج نفسه. هذه الظاهرة تفتح المجال لمزيد من [الأبحاث](/tag/الأبحاث) لفهم كيف يمكن [تحسين أداء](/tag/[تحسين](/tag/تحسين)-[أداء](/tag/أداء)) [نماذج [اللغات](/tag/اللغات) الضخمة](/tag/[نماذج](/tag/نماذج)-[اللغات](/tag/اللغات)-الضخمة) في [استرجاع](/tag/استرجاع) [المعلومات](/tag/المعلومات) الدقيقة.
إذا كنت مهتمًا بالمعرفة العلمية والتطورات في مجال الذكاء الاصطناعي، تابعنا وشاركنا رأيك في [التعليقات](/tag/التعليقات) حول كيفية تأثير هذه الاكتشافات على [مستقبل](/tag/مستقبل) هذه [التكنولوجيا](/tag/التكنولوجيا)!
كيف يؤثر حجم النموذج وتواتر الموضوعات على استرجاع الحقائق في نماذج اللغات الضخمة؟
تسلط دراسة جديدة الضوء على العلاقة بين حجم نماذج اللغات الضخمة (Large Language Models) وتواتر الموضوعات، وتأثيرهما على استرجاع الحقائق. النتائج تظهر أن 60% من تباين الأداء يُفسر بواسطة هذين العاملين.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
