في عالم الذكاء الاصطناعي، يأتي البحث الأخير حول Skill1 كخطوة ثورية في تطوير الوكلاء المدعومين بالمهارات. يمكن لوكلاء نماذج اللغات (Language Model Agents) أن يعيدوا استخدام الاستراتيجيات الناجحة عبر المهام، ولكن كان الحفاظ على مكتبة مهارات متكاملة يتطلب ثلاث قدرات مترابطة: اختيار المهارة المناسبة، استخدامها بفعالية أثناء تنفيذ المهام، وتوليد مهارات جديدة من الخبرات السابقة.
تختلف الأساليب الحالية في تعزيز هذه القدرات، حيث تعالج كل قدرة بشكل منفصل أو باستخدام مصادر مكافآت مختلفة، مما يؤدي إلى تطور جزئي ومتضارب. لكن تدخل Skill1 هنا، كإطار عمل مبتكر يهدف إلى تدريب سياسة واحدة تعمل على تعزيز اختيار المهارة، استخدامها، وتوليد مهارات جديدة، وصولاً إلى هدف مشترك لأداء المهام.
تقوم السياسة في Skill1 بإنشاء استعلام للبحث في مكتبة المهارات، حيث تقوم بإعادة تقييم الخيارات لاختيار المهارة المثلى، ثم تحل المهمة وفقًا لها، وتستخلص مهارة جديدة من مسار التنفيذ. يعتمد هذا التعلم على إشارة واحدة متعلقة بأداء المهمة، مما يضيف بعدًا جديدًا لتقدير فعالية اختيار المهارة مقابل تطوير المهارات.
أشارت التجارب التي أجريت على ALFWorld وWebShop إلى أن Skill1 يتفوق على الأساليب التقليدية المعتمدة على المهارات والتعلم التعزيزي. بالإضافة إلى ذلك، أكدت ديناميات التدريب التفاعل المتبادل بين القدرات الثلاث، في حين أوضحت النتائج أن إزالة أي إشارة ائتمانية تؤدي إلى تدهور التطور.
ثورة في الذكاء الاصطناعي: Skill1 يغير قواعد لعبة الوكلاء المدعومين بالمهارات!
تم الكشف عن Skill1، إطار عمل ثوري يعزز عمل الوكلاء المدعومين بالمهارات عبر التعلم التعزيزي (Reinforcement Learning). يقدم هذا النظام المكتبة الديناميكية للمهارات التي تغير مفهوم تطوير الوكلاء الذكيين بشكل جذري.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
