من أجل تعزيز قدرات الوكلاء الذكيين (OS Agents)، يحتاج التدريب إلى بيانات تتضمن نوايا مستخدمين منظمة، وتفويض مهام متعددة، بالإضافة إلى تنفيذ أدوات حقيقي—وهي عناصر غالبًا ما تفتقر إليها مجموعات البيانات المتاحة حالياً. وهنا يأتي دور نموذج ISE (النوايا -> المحاكاة -> التنفيذ).
يقوم نموذج ISE بتقسيم العملية إلى ثلاث مراحل متميزة:
**المرحلة الأولى: بناء النوايا**
تتمثل هذه المرحلة في إنشاء حوالي 50,000 نية منظمة عبر إطار عمل رباعي الأبعاد (الشخصية x المجال x المهمة x التعقيد). بعد إزالة التكرارات، يحتوي المجموع على 43,956 نية فريدة، محققةً درجة Vendi تقدر بـ 61.57.
**المرحلة الثانية: تفاعل المستخدم مع الوكيل**
تستند هذه المرحلة إلى محاكي مستخدم مقيد بالدور، مما يضمن أن كل تفاعل للمستخدم يعتمد على النتائج الفعلية للتنفيذ، وبهذا يتم إنتاج 23,132 مسارًا كاملاً بمعدل 8.12 جولة مستخدم و68.24 جولة حوار إجمالية.
**المرحلة الثالثة: تنفيذ الأدوات في بيئة مستقلة**
تقوم هذه المرحلة بتشغيل كل استدعاء أداة داخل مساحة عمل نظام تشغيل حية ومعزولة، مما يؤدي إلى ديناميكيات تعافي حقيقية بدلاً من الاستجابات المحاكية.
يحقق نموذج ISE تحسينًا ملحوظًا في الأداء، حيث تم تحسين الأداء في مهمة استخدام الأدوات من 19.3% إلى 37.7% باستخدام نموذج Qwen3-8B. هذا يتفوق على نموذج GPT-4o العائم ونموذج Qwen3-32B الأكبر منه بحوالي أربعة أضعاف.
لن تتوقف الرحلة هنا! تم إصدار جميع شفرات المصدر ومجموعة البيانات للاستخدام العام على GitHub.
**ما رأيكم في هذه الابتكارات التقنية؟ شاركونا في التعليقات!**
هل أنتم مستعدون للتغيير؟ اكتشفوا كيف يغير نموذج ISE طريقة تدريب الوكلاء الذكيين!
يقدم نموذج ISE نهجًا مبتكرًا لتدريب الوكلاء الذكيين، من خلال نظام يتكون من ثلاث مراحل يدعم تفاعلًا أكثر فعالية واستجابة دقيقة. يساعد هذا النظام في تطوير وكلاء ذكيين قادرين على أداء مهام متعددة بشكل أكثر كفاءة.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
