🏷️ #وكالات

4 مقال

AGI Maze: الإطار المثالي لتقييم وكالات نمذجة العالم!

AGI Maze: الإطار المثالي لتقييم وكالات نمذجة العالم!

أركايف للذكاءمنذ 29 يوم

استكشاف جودة العمليات: AgentProcessBench لتقييم فعالية وكالات استخدام الأدوات!

استكشاف جودة العمليات: AgentProcessBench لتقييم فعالية وكالات استخدام الأدوات!

أركايف للذكاءمنذ 1 شهر

اختبار الأدلة الجزئية: معيار جديد للتقييم في أنظمة الوكالة المحدودة

اختبار الأدلة الجزئية: معيار جديد للتقييم في أنظمة الوكالة المحدودة

أركايف للذكاءمنذ 2 شهر

هل يمكن لنماذج اللغة الضخمة (LLMs) تنفيذ نماذج مُعتمدة على الوكلاء؟ دراسة تجريبية مدهشة!

هل يمكن لنماذج اللغة الضخمة (LLMs) تنفيذ نماذج مُعتمدة على الوكلاء؟ دراسة تجريبية مدهشة!

أركايف للذكاءمنذ 3 شهر