Ailoxa Logo

🏷️ #سلامة الذكاء الاصطناعي

50 مقال

ثغرات زمن الاستنتاج: كيف تتحدى نماذج الذكاء الاصطناعي السلامة أثناء التوليد؟
أبحاث

ثغرات زمن الاستنتاج: كيف تتحدى نماذج الذكاء الاصطناعي السلامة أثناء التوليد؟

أركايف للذكاءمنذ 23 ساعة
AICompanionBench: أولى الخطوات نحو سلامة التفاعل بين البشر والذكاء الاصطناعي!
أبحاث

AICompanionBench: أولى الخطوات نحو سلامة التفاعل بين البشر والذكاء الاصطناعي!

أركايف للذكاءمنذ 23 ساعة
الإخفاقات المثيرة في سلامة نماذج الذكاء الاصطناعي: كيف تؤثر المجالات المختلفة على الثقة؟
أخلاقيات الذكاء الاصطناعي

الإخفاقات المثيرة في سلامة نماذج الذكاء الاصطناعي: كيف تؤثر المجالات المختلفة على الثقة؟

أركايف للذكاءمنذ 23 ساعة
دليل توليد السيناريوهات للذكاء الاصطناعي: ضمانات الأمان المثلى لتعلم التعزيز
أبحاث

دليل توليد السيناريوهات للذكاء الاصطناعي: ضمانات الأمان المثلى لتعلم التعزيز

أركايف للذكاءمنذ 23 ساعة
هل نماذج اللغات الضخمة (LLMs) آمنة؟ دراسة مثيرة تكتشف جوانب غامضة في سلوك الذكاء الاصطناعي!
أبحاث

هل نماذج اللغات الضخمة (LLMs) آمنة؟ دراسة مثيرة تكتشف جوانب غامضة في سلوك الذكاء الاصطناعي!

أركايف للذكاءمنذ 23 ساعة
كيف يؤثر تعديل نماذج اللغة الضخمة على سلامتها؟ تحليل جديد يغير اللعبة!
أبحاث

كيف يؤثر تعديل نماذج اللغة الضخمة على سلامتها؟ تحليل جديد يغير اللعبة!

أركايف للذكاءمنذ 1 يوم
درع قوي لضمان السلامة في التعلم المعزز: التطور الجديد!
أبحاث

درع قوي لضمان السلامة في التعلم المعزز: التطور الجديد!

أركايف للذكاءمنذ 2 يوم
MESA: تحسين سلامة نماذج Mixture-of-Experts من خلال الخبرة اللامركزية!
أبحاث

MESA: تحسين سلامة نماذج Mixture-of-Experts من خلال الخبرة اللامركزية!

أركايف للذكاءمنذ 2 يوم
تحديات السلامة في لغات الموارد المنخفضة: هل المشكلة في الأداء أم التمثيل؟
أبحاث

تحديات السلامة في لغات الموارد المنخفضة: هل المشكلة في الأداء أم التمثيل؟

أركايف للذكاءمنذ 2 يوم
المستقبل في الذكاء الاصطناعي: كيف تكشف الإشارات عن سلوك الرفض في نماذج اللغات الضخمة؟
أبحاث

المستقبل في الذكاء الاصطناعي: كيف تكشف الإشارات عن سلوك الرفض في نماذج اللغات الضخمة؟

أركايف للذكاءمنذ 7 يوم
SkillSafetyBench: تقييم أمان الوكلاء في مواجهة هجمات المهارات!
أبحاث

SkillSafetyBench: تقييم أمان الوكلاء في مواجهة هجمات المهارات!

أركايف للذكاءمنذ 7 يوم
إلينوي: تشريعات رائدة لضمان سلامة الذكاء الاصطناعي في أمريكا!
أخلاقيات الذكاء الاصطناعي

إلينوي: تشريعات رائدة لضمان سلامة الذكاء الاصطناعي في أمريكا!

وايردمنذ 8 يوم
تعلم المنهجية: كيف تعزز أمان نماذج الذكاء الاصطناعي بتقنيات جديدة!
أبحاث

تعلم المنهجية: كيف تعزز أمان نماذج الذكاء الاصطناعي بتقنيات جديدة!

أركايف للذكاءمنذ 8 يوم
ثورة في تقييمات الذكاء الاصطناعي: اكتشفوا تقنية LURE وتأثيرها المذهل!
أبحاث

ثورة في تقييمات الذكاء الاصطناعي: اكتشفوا تقنية LURE وتأثيرها المذهل!

أركايف للذكاءمنذ 8 يوم
الحرب الخفية في عالم الذكاء الاصطناعي: كيف يمكن لنماذج اللغة الكبيرة تجاوز يقظة الإنسان الإدراكية؟
أبحاث

الحرب الخفية في عالم الذكاء الاصطناعي: كيف يمكن لنماذج اللغة الكبيرة تجاوز يقظة الإنسان الإدراكية؟

أركايف للذكاءمنذ 8 يوم
اكتشاف المخاطر: GT-HarmBench يقيّم سلامة الذكاء الاصطناعي من خلال نظرية الألعاب
أبحاث

اكتشاف المخاطر: GT-HarmBench يقيّم سلامة الذكاء الاصطناعي من خلال نظرية الألعاب

أركايف للذكاءمنذ 10 يوم
CRAFT: تحوُّل ثوري في سلامة نظم الذكاء الاصطناعي بفضل التعلم من التمثيلات الخفية
أبحاث

CRAFT: تحوُّل ثوري في سلامة نظم الذكاء الاصطناعي بفضل التعلم من التمثيلات الخفية

أركايف للذكاءمنذ 15 يوم
تحذير من موظفين سابقين في OpenAI: سجلات أمان xAI قد تعرقل طرح SpaceX للاكتتاب العام!
أخلاقيات الذكاء الاصطناعي

تحذير من موظفين سابقين في OpenAI: سجلات أمان xAI قد تعرقل طرح SpaceX للاكتتاب العام!

وايردمنذ 16 يوم
التذكر بشكل أفضل، مع مخاطر أكبر: التحديات الأمنية لوكلاء الذكاء الاصطناعي المجهزين بالذاكرة
أبحاث

التذكر بشكل أفضل، مع مخاطر أكبر: التحديات الأمنية لوكلاء الذكاء الاصطناعي المجهزين بالذاكرة

أركايف للذكاءمنذ 16 يوم
هل تتفوق نماذج اللغة المتعددة الأنماط في الأمان؟ اكتشافات جديدة حول انهيار هندسة الأمان
أبحاث

هل تتفوق نماذج اللغة المتعددة الأنماط في الأمان؟ اكتشافات جديدة حول انهيار هندسة الأمان

أركايف للذكاءمنذ 16 يوم