Ailoxa Logo

🏷️ #تقييم

176 مقال

ثورة في تقييم الذكاء الاصطناعي السريري: اكتشافات جديدة تكشف عن إمكانيات خفية!
أبحاث

ثورة في تقييم الذكاء الاصطناعي السريري: اكتشافات جديدة تكشف عن إمكانيات خفية!

أركايف للذكاءمنذ 4 يوم
ثورة في علم الأحياء: تقييم الكيانات الحيوية بمساعدة الذكاء الاصطناعي
أبحاث

ثورة في علم الأحياء: تقييم الكيانات الحيوية بمساعدة الذكاء الاصطناعي

أركايف للذكاءمنذ 4 يوم
ثورة في تقييم الذكاء الاصطناعي: كيف يمكن لنموذج LLM أن يصبح قاضياً موثوقاً؟
أبحاث

ثورة في تقييم الذكاء الاصطناعي: كيف يمكن لنموذج LLM أن يصبح قاضياً موثوقاً؟

أركايف للذكاءمنذ 4 يوم
إصلاح طرق تقييم تمثيلات تخطيط القلب الكهربائي: خطوة نحو تحسين دقة البيانات السريرية!
أبحاث

إصلاح طرق تقييم تمثيلات تخطيط القلب الكهربائي: خطوة نحو تحسين دقة البيانات السريرية!

أركايف للذكاءمنذ 4 يوم
مغامرات العقل: ساحة جديدة لتقييم التفكير الاجتماعي والاستراتيجي في نماذج اللغة المتعددة العملاء!
أبحاث

مغامرات العقل: ساحة جديدة لتقييم التفكير الاجتماعي والاستراتيجي في نماذج اللغة المتعددة العملاء!

أركايف للذكاءمنذ 7 يوم
TRACE: تقييم عملية التفكير المنطقي في نماذج اللغة الكبيرة بطريقة جديدة!
نماذج لغوية

TRACE: تقييم عملية التفكير المنطقي في نماذج اللغة الكبيرة بطريقة جديدة!

أركايف للذكاءمنذ 7 يوم
SCDBench: معيار ثوري لفحص أدوات فك تجميع العقود الذكية المدعومة بالذكاء الاصطناعي
أبحاث

SCDBench: معيار ثوري لفحص أدوات فك تجميع العقود الذكية المدعومة بالذكاء الاصطناعي

أركايف للذكاءمنذ 7 يوم
قياس تمكين وكلاء نماذج اللغة: كيف يسهم الذكاء الاصطناعي في تعزيز الأداء الفعّال؟
أبحاث

قياس تمكين وكلاء نماذج اللغة: كيف يسهم الذكاء الاصطناعي في تعزيز الأداء الفعّال؟

أركايف للذكاءمنذ 7 يوم
JMed48k: المعيار الثوري لاختبار الترخيص الطبي في اليابان يقيّم نماذج الرؤية واللغة
أبحاث

JMed48k: المعيار الثوري لاختبار الترخيص الطبي في اليابان يقيّم نماذج الرؤية واللغة

أركايف للذكاءمنذ 7 يوم
معيار جديد لتقييم أنظمة الذكاء الاصطناعي! استكشف كيف يتم قياس كفاءة نماذج اللغات الضخمة كحكام
أبحاث

معيار جديد لتقييم أنظمة الذكاء الاصطناعي! استكشف كيف يتم قياس كفاءة نماذج اللغات الضخمة كحكام

أركايف للذكاءمنذ 8 يوم
ابتكار إطار موحد لتقييم قدرات الوكلاء في نماذج اللغات الضخمة
أبحاث

ابتكار إطار موحد لتقييم قدرات الوكلاء في نماذج اللغات الضخمة

أركايف للذكاءمنذ 8 يوم
MIRA: معايير مبتكرة لتحسين دقة المعلومات الطبية عبر اللغات
أبحاث

MIRA: معايير مبتكرة لتحسين دقة المعلومات الطبية عبر اللغات

أركايف للذكاءمنذ 8 يوم
كيف تعيد الذكاء الاصطناعي تشكيل التعليم العالي؟ نموذج رياضي لفهم الاستخدام الأخلاقي!
أخلاقيات الذكاء الاصطناعي

كيف تعيد الذكاء الاصطناعي تشكيل التعليم العالي؟ نموذج رياضي لفهم الاستخدام الأخلاقي!

أركايف للذكاءمنذ 8 يوم
إطار RAGe: ثورة في تقييم تطبيقات الذكاء الاصطناعي المعززة بالاسترجاع
أدوات

إطار RAGe: ثورة في تقييم تطبيقات الذكاء الاصطناعي المعززة بالاسترجاع

أركايف للذكاءمنذ 8 يوم
لماذا يجب على مجتمع الذكاء الاصطناعي التخلي عن مصطلح "الباب الخلفي الإيجابي"؟
أخلاقيات الذكاء الاصطناعي

لماذا يجب على مجتمع الذكاء الاصطناعي التخلي عن مصطلح "الباب الخلفي الإيجابي"؟

أركايف للذكاءمنذ 8 يوم
فجوة المراقبة والتحكم: لماذا لا تكفي نماذج الذكاء الاصطناعي لاستجابة فعالة
أبحاث

فجوة المراقبة والتحكم: لماذا لا تكفي نماذج الذكاء الاصطناعي لاستجابة فعالة

أركايف للذكاءمنذ 9 يوم
RepoMirage: هل يمكن لوكلاء البرمجيات فهم سياق المستودعات البرمجية؟
أبحاث

RepoMirage: هل يمكن لوكلاء البرمجيات فهم سياق المستودعات البرمجية؟

أركايف للذكاءمنذ 9 يوم
استراتيجيات مبتكرة لتقييم الملخصات البحثية المُولّدة: كيف ستكون المستقبل!
أبحاث

استراتيجيات مبتكرة لتقييم الملخصات البحثية المُولّدة: كيف ستكون المستقبل!

أركايف للذكاءمنذ 9 يوم
Verus-SpecGym: بيئة مبتكرة لتقييم تحويل المواصفات بدقة!
أبحاث

Verus-SpecGym: بيئة مبتكرة لتقييم تحويل المواصفات بدقة!

أركايف للذكاءمنذ 9 يوم
TowerMind: بيئة جديدة للألعاب الدفاعية تثبت قوة نماذج اللغات الكبيرة كعملاء ذكيين!
أبحاث

TowerMind: بيئة جديدة للألعاب الدفاعية تثبت قوة نماذج اللغات الكبيرة كعملاء ذكيين!

أركايف للذكاءمنذ 9 يوم