تصحيح الانحياز العشوائي في محسنات نماذج اللغة: ثورة في تدريب الذكاء الاصطناعي!

Q: ما هو موضوع مقال "تصحيح الانحياز العشوائي في محسنات نماذج اللغة: ثورة في تدريب الذكاء الاصطناعي!"؟

يتناول المقال بالتفصيل والتحليل آخر الأخبار والتطورات المتعلقة بـ "تصحيح الانحياز العشوائي في محسنات نماذج اللغة: ثورة في تدريب الذكاء الاصطناعي!" في عالم الذكاء الاصطناعي والتكنولوجيا الناشئة.

في عالم الذكاء الاصطناعي، تلعب محسنات (optimizers) نماذج اللغة دوراً محورياً في تدريب هذه النماذج. ومع ذلك، فإن القواعد العشوائية المستخدمة في تحديث هذه المحسنات دائماً ما يتم التعامل معها كقربات مباشرة لهبوط مهيأ للسكان. لكن دراسة جديدة تكشف عن وجود انحيازات finite-sample قد نقوم بتجاهلها.

أولاً، يعد تقدير التدرج (gradient) والمهيئ (preconditioner) عادةً من نفس مجموعة الدفعات (minibatch)، مما يؤدي إلى انحياز الاقتران بين التدرج والمهيئ. وثانياً، حتى عند تقدير المهيئ بشكل غير منحاز، فإن عكسه أو جذره العكسي قد يرتكب انحيازاً لأن حالة العكس غير خطية.

تقدم هذه الدراسة إطار تصحيح انحياز لعلاج كلا التأثيرين. وتتضمن تقنية "التقدير المتقاطع" استخدام تقديرات مستقلة من مجموعات صغيرة، بينما تقوم "العكس المصحح للمتغير" باستخدام تقلبات المجموعات الصغيرة لطرح المصطلح الرئيسي في انحياز الطريقة دلتية.

يتم تطبيق هذا الإطار على طرق المهيئة القطرية ومهيئات المصفوفات، مثل AdamW وSophia وShampoo. وأسفرت نتائج تصحيح الانحياز عن تقليل خسارة التهيئة المحتفظ بها بنسبة 0.15 و0.07 و0.11 ناتًا على التوالي في نموذج Qwen2.5-0.5B، مما يظهر تأثيرات إيجابية محايدة بطريقة مستمرة.

تثبت هذه النتائج مجتمعة أن تصحيح الانحياز يعد آلية عملية لتقليل انحياز التحديثات في عينات صغيرة وتحسين أداء المحسنين المهيئين. هل تشعر بحماس لمعرفة كيف يمكن لهذه التحسينات أن تؤثر على مستقبل الذكاء الاصطناعي؟

تصحيح الانحياز العشوائي في محسنات نماذج اللغة: ثورة في تدريب الذكاء الاصطناعي!

شارك الخبر مع أصدقائك

📰أخبار قد تهمك

ثورة ذكاء اصطناعي: المساعد الجديد من أدوبي يمكنه إنجاز المهام عبر جميع تطبيقاتك الإبداعية!

ثورة جديدة في عالم الحوسبة: استثمار ضخم ينذر بإطلاق عملاق الحوسبة التالي

هل تتجه أنظار المستثمرين نحو Anthropic بعد موجة الدولار؟