في عصر الذكاء الاصطناعي، أصبحت نماذج اللغات الضخمة (Large Language Models - LLMs) أداة رئيسية في معالجة اللغة الطبيعية، حيث حققت إنجازات كبيرة في كيفية فهم النصوص وتوليدها. ومع ذلك، فإن واحدة من التحديات الكبيرة التي تواجه هذه النماذج هي "الهلاوس"، وهي المعلومات التي تتعارض مع الحقائق، مما يؤثر سلبًا على موثوقيتها.
في دراسة حديثة، تم إجراء تحليل شامل لعملية فك الترميز في نماذج اللغات الضخمة، وإظهار أن الهلاوس غالباً ما تنشأ من الطبقات الأعمق في عملية فك الترميز. وللتصدي لهذه المشكلة، تم تقديم إطار عمل جديد يسمى "DeLask"، والذي يعني "تخطي طبقات فك الترميز". يهدف DeLask، بذكاء، إلى تخطي الطبقات التي تميل لإنتاج هلاوس دون فقدان المعلومات الضرورية.
يعتمد هذا الإطار على فكرة نظرية تفيد بأن الحساب الأمامي للترانزفورمر (Transformer) الذي يتكون من $L$ طبقة يعادل بشكل شرطي $L$ خطوة من الانحدار التدرجي. قدم الباحثون قيمة تدعى "قيمة الانجراف" (driftance value) تحسب من خلال قياس التشابه الكوسيني بين التدرجات الناتجة من خطوات فك الترميز المتتالية. من خلال تحديد الطبقات التي تعكس اتجاهها، يمكن التعامل معها بشكل أكثر فعالية.
بدلاً من تجاهل هذه الطبقات، يقوم DeLask بتجميع الحالات المخفية الخاصة بها جزئياً مع الطبقات السابقة، مما يساعد على الحفاظ على التناسق وتقليل الإشارات الخاطئة.
أثبتت التجارب الواسعة التي أجريت على نماذج لغوية متعددة مع مجموعة متنوعة من المعايير أن DeLask يساهم في تقليل الهلاوس بشكل كبير ويحسن من موثوقية النماذج، مما يوفر إطار عمل خفيف وعملي لتحسين قوة النماذج اللغوية الكبيرة.
تجاوز الأخطاء في نماذج اللغات الضخمة: اكتشف إطار DeLask المبتكر!
تعتبر نماذج اللغات الضخمة قوية ولكنها تواجه مشاكل في إنتاج معلومات غير دقيقة. يقدم البحث الجديد إطار DeLask لحل هذه المشكلة بذكاء وفعالية.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
