🏷️ #وكالات
3 مقال
أبحاث
استكشاف جودة العمليات: AgentProcessBench لتقييم فعالية وكالات استخدام الأدوات!
أركايف للذكاءمنذ 14 يوم
👁 1أبحاث
اختبار الأدلة الجزئية: معيار جديد للتقييم في أنظمة الوكالة المحدودة
أركايف للذكاءمنذ 1 شهر
أبحاث
هل يمكن لنماذج اللغة الضخمة (LLMs) تنفيذ نماذج مُعتمدة على الوكلاء؟ دراسة تجريبية مدهشة!
أركايف للذكاءمنذ 1 شهر
