🏷️ #تقييم

273 مقال

ثورة جديدة في الذكاء الاصطناعي: أداة RuBench للتقييم الذكي بلغة روسية!

ثورة جديدة في الذكاء الاصطناعي: أداة RuBench للتقييم الذكي بلغة روسية!

أركايف للذكاءمنذ 13 يوم

نموذج حواري مبتكر: تقييم تلقائي لحوارات الإرشاد باللغة اليابانية باستخدام الذكاء الاصطناعي

نموذج حواري مبتكر: تقييم تلقائي لحوارات الإرشاد باللغة اليابانية باستخدام الذكاء الاصطناعي

أركايف للذكاءمنذ 14 يوم

RoboDojo: معيار ثوري لتقييم أداء الروبوتات في العالم الافتراضي والواقعي!

RoboDojo: معيار ثوري لتقييم أداء الروبوتات في العالم الافتراضي والواقعي!

أركايف للذكاءمنذ 14 يوم

ثورة جديدة في تقييم الذكاء الاصطناعي: كيف يعمل BoRP على تحسين رضا المستخدمين؟

ثورة جديدة في تقييم الذكاء الاصطناعي: كيف يعمل BoRP على تحسين رضا المستخدمين؟

أركايف للذكاءمنذ 14 يوم

فجوة تقييم الذكاء الاصطناعي في السياسة الخارجية: تحديات جديدة أمام حكومات الذكاء الاصطناعي!

فجوة تقييم الذكاء الاصطناعي في السياسة الخارجية: تحديات جديدة أمام حكومات الذكاء الاصطناعي!

أركايف للذكاءمنذ 14 يوم

AgenticDataBench: المرجع الشامل لوكلاء البيانات الثورية!

AgenticDataBench: المرجع الشامل لوكلاء البيانات الثورية!

أركايف للذكاءمنذ 18 يوم

تحديات وتوصيات لاستخدام نماذج الذكاء الاصطناعي كقضاة في التقييمات متعددة اللغات

تحديات وتوصيات لاستخدام نماذج الذكاء الاصطناعي كقضاة في التقييمات متعددة اللغات

أركايف للذكاءمنذ 18 يوم

ثورة جديدة في فهم الملفات المكتبية: اختبار Office Comprehension Benchmark!

نماذج لغوية

ثورة جديدة في فهم الملفات المكتبية: اختبار Office Comprehension Benchmark!

أركايف للذكاءمنذ 18 يوم

اختبار الطيران: معيار ثوري لتقييم نماذج الذكاء الاصطناعي في قطاع الطيران

اختبار الطيران: معيار ثوري لتقييم نماذج الذكاء الاصطناعي في قطاع الطيران

أركايف للذكاءمنذ 18 يوم

دراسة جديدة تكشف: كيف تؤثر إطارات المطالبات على تقييم أداء نماذج الذكاء الاصطناعي في الكشف عن الأخطاء!

دراسة جديدة تكشف: كيف تؤثر إطارات المطالبات على تقييم أداء نماذج الذكاء الاصطناعي في الكشف عن الأخطاء!

أركايف للذكاءمنذ 18 يوم

MindEdit-Bench: معيار جديد لتقييم قدرة نماذج اللغة والرؤية على التفكير المكاني النقدي

MindEdit-Bench: معيار جديد لتقييم قدرة نماذج اللغة والرؤية على التفكير المكاني النقدي

أركايف للذكاءمنذ 19 يوم

ثورة في تقنيات التعلم غير المحدود: تقييم عملية النسيان في نماذج اللغة ذات الذاكرة المحدودة

ثورة في تقنيات التعلم غير المحدود: تقييم عملية النسيان في نماذج اللغة ذات الذاكرة المحدودة

أركايف للذكاءمنذ 19 يوم

سيفورا: إطار تقييم التعليقات ودعم الكتابة للطلاب باستخدام الذكاء الاصطناعي

سيفورا: إطار تقييم التعليقات ودعم الكتابة للطلاب باستخدام الذكاء الاصطناعي

أركايف للذكاءمنذ 19 يوم

AGI Maze: الإطار المثالي لتقييم وكالات نمذجة العالم!

AGI Maze: الإطار المثالي لتقييم وكالات نمذجة العالم!

أركايف للذكاءمنذ 19 يوم

تقييم سلامة الذكاء الاصطناعي: منهجية جديدة لاختبار سلوك النماذج اللغوية!

تقييم سلامة الذكاء الاصطناعي: منهجية جديدة لاختبار سلوك النماذج اللغوية!

أركايف للذكاءمنذ 19 يوم

تحديات حماية حقوق الطبع والنشر في العصر الرقمي: تقييم إطار جديد باستخدام نماذج اللغات الضخمة!

تحديات حماية حقوق الطبع والنشر في العصر الرقمي: تقييم إطار جديد باستخدام نماذج اللغات الضخمة!

أركايف للذكاءمنذ 20 يوم

كيف يمكن لتقنيات التقييم أن تقلل من تحيزات النماذج اللغوية الضخمة؟

كيف يمكن لتقنيات التقييم أن تقلل من تحيزات النماذج اللغوية الضخمة؟

أركايف للذكاءمنذ 20 يوم

روبوست بانل: ثورة جديدة في تقييم نماذج الذكاء الاصطناعي!

روبوست بانل: ثورة جديدة في تقييم نماذج الذكاء الاصطناعي!

أركايف للذكاءمنذ 20 يوم

تطور جديد في أمان نماذج الذكاء الاصطناعي: Introducing CASE-Bench!

تطور جديد في أمان نماذج الذكاء الاصطناعي: Introducing CASE-Bench!

أركايف للذكاءمنذ 21 يوم

إعادة التفكير في تقييم دور اللعب: تقنيات جديدة لتجاوز قيود الشخصية

إعادة التفكير في تقييم دور اللعب: تقنيات جديدة لتجاوز قيود الشخصية

أركايف للذكاءمنذ 21 يوم

← السابق2 / 14التالي →