🏷️ #مقاييس
6 مقال
أبحاث
100-LongBench: هل تختبر المعايير الطويلة فعلاً قدرات النماذج في تحليل السياقات الطويلة؟
أركايف للذكاءمنذ 12 يوم
👁 1أبحاث
در دكتور: مقياس ثوري لتحديات تحليل الوثائق المعقدة!
أركايف للذكاءمنذ 14 يوم
👁 1أبحاث
الفحص الدقيق للقدرة التنبؤية: كيف نتجاوز تحديات التغطية الشرطية؟
أركايف للذكاءمنذ 15 يوم
أبحاث
دمج ميزات مدعومة بالمتر من نماذج البنية المرئية لتحسين مهام التحليل الدقيق
أركايف للذكاءمنذ 28 يوم
أبحاث
الثورة في تقييم نماذج اللغة: مقاييس جديدة للكفاءة دون الحاجة للتعليقات!
أركايف للذكاءمنذ 1 شهر
أبحاث
هل السكين تسيطر على المرأة أم العكس؟ قياس انحياز الاتجاه في تسميات الصور بشكل جديد!
أركايف للذكاءمنذ 1 شهر
