ثورة في الذكاء الاصطناعي: تحسين توزيع المكافآت في التعلم المعزز لنماذج اللغات الضخمة

Q: ما هو موضوع مقال "ثورة في الذكاء الاصطناعي: تحسين توزيع المكافآت في التعلم المعزز لنماذج اللغات الضخمة"؟

يتناول المقال بالتفصيل والتحليل آخر الأخبار والتطورات المتعلقة بـ "ثورة في الذكاء الاصطناعي: تحسين توزيع المكافآت في التعلم المعزز لنماذج اللغات الضخمة" في عالم الذكاء الاصطناعي والتكنولوجيا الناشئة.

في خطوة متقدمة نحو تحسين أداء نماذج اللغات الضخمة (Large Language Models)، قدم الباحثون تقنية مبتكرة تُعرف بـ"توزيع المكافآت الواعي" (Distribution-Aware Reward). هذه التقنية تهدف إلى تعزيز قدرتها على التنبؤ بالقيم الحقيقية من مدخلات متنوعة، مثل النصوص، الأكواد، والسلاسل الجزيئية.

عادةً، تعتمد معظم الأهداف التدريبية على تقييم كل عدد عائم بشكل مستقل، مما يحسن من تقديرات النقاط دون ضمان توزيع توقعات مُعيرة، وهو ما يقلل من القدرة على تطبيق تقنيات تتطلب تصنيف المرشحين أو تقدير عدم اليقين.

تسعى طريقة "توزيع المكافآت الواعي" إلى معالجة هذا القصور من خلال تدريب نماذج اللغة لتوليد توزيعات متوقعة أفضل في مهام الانحدار، بدلاً من مجرد تحسين المخرجات المفردة مقابل الأهداف العددية. في هذه الطريقة، تُعتبر العينات المتعددة المُنتجة من نماذج اللغة توزيعًا تخيليًا تجريبيًا، حيث يتم تقييمها باستخدام مؤشر الدرجات المستمرة المصنفة (Continuous Ranked Probability Score)، وتوزع المكافآت بناءً على الإسهام الهام لكل جولة في جودة التوزيع.

لقد تم تقييم هذه التقنية على مهام متعددة مثل نموذج منفصل لجداول غاوسي، وتنبؤ أداء الأكواد، وتنبؤ الخصائص الجزيئية من سلاسل SMILES. وُجد أن طريقتنا تُظهر تحسناً ملحوظًا على أساليب التدريب الخاضع للإشراف، مما يعزز من قدرتها على تصنيف النتائج بشكل أفضل، مع تحقيق تقدم ملحوظ يبلغ 6 نقاط في مقياس سبيرمان (Spearman) على مجموعة بيانات KBSS.

عند تطبيقها على MoleculeNet باستخدام مجرد سلاسل SMILES، أظهرت الطريقة تنافسية قوية مع نماذج الجزيئات المعتمدة على الرسوم البيانية والنماذج الجزيئية ثلاثية الأبعاد، مما يُشير إلى فعالية عالية. تشير التحليلات الإضافية إلى أن هذه التقنية تساهم في تقليل مشكلة انهيار تنويع العروض وتحسين تشخيص عدم اليقين، مما يعكس أن تحسين توزيعات التوقعات مباشرةً يجعل النماذج اللغوية أكثر قوة ودقة في التنبؤ.

ثورة في الذكاء الاصطناعي: تحسين توزيع المكافآت في التعلم المعزز لنماذج اللغات الضخمة

شارك الخبر مع أصدقائك

📰أخبار قد تهمك

من نماذج اللغات الضخمة إلى الهلوسات: دليلك الشامل لأهم مصطلحات الذكاء الاصطناعي!

ثورة جديدة في الذكاء الاصطناعي: Salesforce تطلق Slackbot المتطور لمنافسة Microsoft وGoogle في عالم الأعمال

ثورة جديدة في عالم البرمجة: شركة Gitar الناشئة تؤمن الكود باستخدام الذكاء الاصطناعي!