🏷️ #سلامة الذكاء الاصطناعي
50 مقال
أبحاث
ثغرات زمن الاستنتاج: كيف تتحدى نماذج الذكاء الاصطناعي السلامة أثناء التوليد؟
أركايف للذكاءمنذ 1 يوم
أبحاث
AICompanionBench: أولى الخطوات نحو سلامة التفاعل بين البشر والذكاء الاصطناعي!
أركايف للذكاءمنذ 1 يوم
أخلاقيات الذكاء الاصطناعي
الإخفاقات المثيرة في سلامة نماذج الذكاء الاصطناعي: كيف تؤثر المجالات المختلفة على الثقة؟
أركايف للذكاءمنذ 1 يوم
أبحاث
دليل توليد السيناريوهات للذكاء الاصطناعي: ضمانات الأمان المثلى لتعلم التعزيز
أركايف للذكاءمنذ 1 يوم
أبحاث
هل نماذج اللغات الضخمة (LLMs) آمنة؟ دراسة مثيرة تكتشف جوانب غامضة في سلوك الذكاء الاصطناعي!
أركايف للذكاءمنذ 1 يوم
أبحاث
كيف يؤثر تعديل نماذج اللغة الضخمة على سلامتها؟ تحليل جديد يغير اللعبة!
أركايف للذكاءمنذ 2 يوم
أبحاث
درع قوي لضمان السلامة في التعلم المعزز: التطور الجديد!
أركايف للذكاءمنذ 3 يوم
أبحاث
MESA: تحسين سلامة نماذج Mixture-of-Experts من خلال الخبرة اللامركزية!
أركايف للذكاءمنذ 3 يوم
أبحاث
تحديات السلامة في لغات الموارد المنخفضة: هل المشكلة في الأداء أم التمثيل؟
أركايف للذكاءمنذ 3 يوم
أبحاث
المستقبل في الذكاء الاصطناعي: كيف تكشف الإشارات عن سلوك الرفض في نماذج اللغات الضخمة؟
أركايف للذكاءمنذ 8 يوم
أبحاث
SkillSafetyBench: تقييم أمان الوكلاء في مواجهة هجمات المهارات!
أركايف للذكاءمنذ 8 يوم
أخلاقيات الذكاء الاصطناعي
إلينوي: تشريعات رائدة لضمان سلامة الذكاء الاصطناعي في أمريكا!
وايردمنذ 8 يوم
أبحاث
تعلم المنهجية: كيف تعزز أمان نماذج الذكاء الاصطناعي بتقنيات جديدة!
أركايف للذكاءمنذ 9 يوم
أبحاث
ثورة في تقييمات الذكاء الاصطناعي: اكتشفوا تقنية LURE وتأثيرها المذهل!
أركايف للذكاءمنذ 9 يوم
أبحاث
الحرب الخفية في عالم الذكاء الاصطناعي: كيف يمكن لنماذج اللغة الكبيرة تجاوز يقظة الإنسان الإدراكية؟
أركايف للذكاءمنذ 9 يوم
أبحاث
اكتشاف المخاطر: GT-HarmBench يقيّم سلامة الذكاء الاصطناعي من خلال نظرية الألعاب
أركايف للذكاءمنذ 11 يوم
أبحاث
CRAFT: تحوُّل ثوري في سلامة نظم الذكاء الاصطناعي بفضل التعلم من التمثيلات الخفية
أركايف للذكاءمنذ 16 يوم
أخلاقيات الذكاء الاصطناعي
تحذير من موظفين سابقين في OpenAI: سجلات أمان xAI قد تعرقل طرح SpaceX للاكتتاب العام!
وايردمنذ 16 يوم
أبحاث
التذكر بشكل أفضل، مع مخاطر أكبر: التحديات الأمنية لوكلاء الذكاء الاصطناعي المجهزين بالذاكرة
أركايف للذكاءمنذ 17 يوم
أبحاث
هل تتفوق نماذج اللغة المتعددة الأنماط في الأمان؟ اكتشافات جديدة حول انهيار هندسة الأمان
أركايف للذكاءمنذ 17 يوم
1 / 3التالي →
