تعتبر نماذج اللغات الضخمة (Large Language Models) من بين أكثر التقنيات تطوراً في مجال الذكاء الاصطناعي، حيث تعتمد بشكل أساسي على قدرتها في التفاعل مع بيئتها واستخدام الأدوات بفاعلية. لكن، تواجه هذه النماذج تحديات كبيرة بسبب عدم توفر أطر تعلم معززة (Reinforcement Learning) فعالة مصممة خصيصاً لاستخدام الأدوات، بالتحديد في بناء بيئات تدريب مستقرة.
للتغلب على هذه التحديات، قدّم الباحثون نظاماً جديداً لبناء بيئات تدريب آلية، يتضمن تفكيك السيناريوهات، إنشاء الوثائق، تكامل الوظائف، وتوازن التعقيد، وكذلك النشر المحلي. هذه التقنية تسمح بإنشاء بيئات تدريب عالية الجودة توفر ملاحظات دقيقة وقابلة للقياس دون الاعتماد على أدوات خارجية.
بالإضافة إلى ذلك، تم تقديم آلية مكافأة قابلة للتحقق تدعم تقييم دقة استخدام الأدوات وكمال تنفيذ المهام. عند دمجها مع بيانات المسارات التي تم جمعها من البيئات المدعومة، تتكامل هذه الآلية بسلاسة مع خوارزميات التعلم المعزز القياسية، مما يسهل تدريب النماذج المدفوعة بالتغذية الراجعة.
تظهر التجارب التي أجريت على نماذج لغات ضخمة بمقاييس متفاوتة أن هذه المنهجية تعزز بشكل كبير أداء النماذج في استخدام الأدوات دون التأثير السلبي على قدراتها العامة. وتشير التحليلات إلى أن هذه التحسينات مأخوذة من فهم أفضل للسياقات والتفكير، والناتجة عن تحديثات في معلمات الشبكات العصبية الدنيا في النماذج.
تحسينات مثيرة في استخدام الأدوات عبر نماذج اللغات الضخمة من خلال بيئات البناء الآلي
يقدم الباحثون تقنية جديدة لتحسين أداء نماذج اللغات الضخمة في استخدام الأدوات، مما يساهم في تعزيز قدرتها على التفاعل مع بيئتها. تستخدم هذه التقنية بيئات بناء آلية لتوفير تقييم دقيق لمهارات النماذج، مما يؤدي إلى تحسينات ملحوظة في فهم السياق والتفكير.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
