ثورة جديدة: كيف تصنع LLMs ذاتية التطور بكفاءة من خلال التعلم المعزز

في عالم الذكاء الاصطناعي، تطورت نماذج اللغات الكبيرة (LLMs) بشكل كبير، لكن التحديات المتعلقة بتكاليف التوسيم العالية والاستراتيجيات التقليدية لا تزال تعيق تطورها. لكن الآن، توصل الباحثون إلى نهج جديد يدعى EasyRL، يستلهم من نظرية التعلم الإدراكي لتقديم حل مثير ومبتكر.

تكمن فكرة EasyRL في محاكاة منحنى اكتساب المعرفة البشري، حيث يتم دمج نقل المعرفة القابلة للاعتماد من البيانات الموسومة البسيطة مع استراتيجية تقسيم وتغلب تدريجية تتناول البيانات غير الموسومة الأكثر صعوبة. تبدأ العملية باستخدام نموذج ساخن من خلال التعلم المعزز الخاضع للإشراف (supervised RL) مع عدد قليل من البيانات الموسومة، ثم تتبعه استراتيجية تسمية شبه ذاتية على البيانات غير الموسومة الصعبة.

تشمل هذه الاستراتيجية اختيار الحالات ذات اليقين المنخفض والتسوية في الحالات ذات اليقين المتوسط، مما يعزز قدرة النموذج على الاستدلال. ومن خلال التدريب الذاتي التدريجي مع التقنيات الحديثة، يتمكن EasyRL من تحسين الأداء بكفاءة.

نتائج التجارب على معايير رياضية وعلمية تظهر أن EasyRL، باستخدام 10% فقط من البيانات الموسومة السهلة، يتفوق باستمرار على الأساليب الرائدة الأخرى. هذه الابتكارات ليست فقط مذهلة بل تقدم مسارًا واعدًا لتطبيقات أكثر فاعلية في المستقبل.

ما رأيكم في هذا التطور؟ شاركونا في التعليقات.

ثورة جديدة: كيف تصنع LLMs ذاتية التطور بكفاءة من خلال التعلم المعزز

شارك الخبر مع أصدقائك

📰أخبار قد تهمك

هل تتعذر عليك الحصول على جهاز Mac Mini؟ تعرف على السبب وراء التأخير في التوريد!

هل يحدد OpenAI مستقبل الأمن السيبراني؟ الكشف عن أداة GPT-5.5 Cyber المبتكرة!

إيلون ماسك يكشف السر: كيف قامت xAI بتدريب Grok باستخدام نماذج OpenAI!