في عالم الذكاء الاصطناعي، تُعتبر نماذج Transformer من اللبنات الأساسية التي تقوم عليها العديد من الأنظمة الحديثة. ومع ذلك، تعاني هذه النماذج من نقص في القدرة على التعامل مع عدم اليقين، وهو أمر شائع في التطبيقات الواقعية مثل التوصية للمستخدمين الجدد وتنوع جودة الإشارات في نماذج اللغة.
تقدم ورقة جديدة مفهوم 'Transformer باستخدام مرشح بايزي' (Bayesian Filtering Transformer - BFT) الذي يعالج هذه القضية المستعصية. من خلال هذا المفهوم، يتم تعديل آلية الانتباه لتصبح تعتمد على دقة القياسات باستخدام طريقة Kriging، بينما تصبح الروابط المتبقية في النموذج تحديثات كالمَن ذات مكاسب قابلة للتكيف.
هذه التعديلات لا تتطلب إضافة عبء كبير للنموذج، مما يسهل دمجها في أي بنية Transformer. على سبيل المثال، عند تطبيق BFT على ثلاثة نماذج رئيسية في مجال التوصية، تم تحقيق تحسينات كبيرة عبر ست معايير تقييم، مع تحقيق أكبر المكاسب في الحالات التي تكون فيها درجة عدم اليقين مرتفعة، مثل المستخدمين الجدد والمنتجات النادرة.
بالإضافة إلى ذلك، تظهر النتائج أن BFT يُعزز من قوة التحمل في عملية التدريب الإشرافي لنموذج اللغة الكبير مع البيانات الم noisy، حيث يُسهم في تقليل التلوث الناتج عن علامات غير دقيقة وسياقات مضطربة.
إن مجرد تعديل واحد يهدف إلى استعادة دقة القياسات يُمكن أن يُحدث فرقاً كبيراً في الأداء، ليس فقط في النماذج التقليدية، بل أيضاً في نماذج اللغات الكبيرة (Large Language Models - LLMs).
ما رأيكم في هذا التطور المثير في مجال الذكاء الاصطناعي؟ شاركونا في التعليقات.
تحويل بايزي دقيق: كيفية تحسين نماذج الذكاء الاصطناعي باستخدام آلية كالمَن ورؤية جديدة!
تقدم الورقة العلمية مفهوم 'Transformer باستخدام مرشح بايزي' لتحسين دقة نماذج الذكاء الاصطناعي، حيث يعالج عدم اليقين في التطبيقات الحقيقية بشكل فعال. ويتضمن ذلك استخدام تقنيات مثل كالمَن وKriging لتحسين أداء النماذج في التوصية والتعلم من البيانات الم noisy.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
