🏷️ #سلامة الذكاء الاصطناعي

72 مقال

VESTA: إطار مبتكر لتوليد السيناريوهات وتقييم السلامة للوكالات الذكية

VESTA: إطار مبتكر لتوليد السيناريوهات وتقييم السلامة للوكالات الذكية

أركايف للذكاءمنذ 1 شهر

تحطيم قيود سلوك الآلات: الابتكار في تقييم الأنظمة متعددة الوكلاء

تحطيم قيود سلوك الآلات: الابتكار في تقييم الأنظمة متعددة الوكلاء

أركايف للذكاءمنذ 1 شهر

ثغرات زمن الاستنتاج: كيف تتحدى نماذج الذكاء الاصطناعي السلامة أثناء التوليد؟

ثغرات زمن الاستنتاج: كيف تتحدى نماذج الذكاء الاصطناعي السلامة أثناء التوليد؟

أركايف للذكاءمنذ 1 شهر

هل نماذج اللغات الضخمة (LLMs) آمنة؟ دراسة مثيرة تكتشف جوانب غامضة في سلوك الذكاء الاصطناعي!

هل نماذج اللغات الضخمة (LLMs) آمنة؟ دراسة مثيرة تكتشف جوانب غامضة في سلوك الذكاء الاصطناعي!

أركايف للذكاءمنذ 1 شهر

دليل توليد السيناريوهات للذكاء الاصطناعي: ضمانات الأمان المثلى لتعلم التعزيز

دليل توليد السيناريوهات للذكاء الاصطناعي: ضمانات الأمان المثلى لتعلم التعزيز

أركايف للذكاءمنذ 1 شهر

الإخفاقات المثيرة في سلامة نماذج الذكاء الاصطناعي: كيف تؤثر المجالات المختلفة على الثقة؟

أخلاقيات الذكاء الاصطناعي

الإخفاقات المثيرة في سلامة نماذج الذكاء الاصطناعي: كيف تؤثر المجالات المختلفة على الثقة؟

أركايف للذكاءمنذ 1 شهر

AICompanionBench: أولى الخطوات نحو سلامة التفاعل بين البشر والذكاء الاصطناعي!

AICompanionBench: أولى الخطوات نحو سلامة التفاعل بين البشر والذكاء الاصطناعي!

أركايف للذكاءمنذ 1 شهر

كيف يؤثر تعديل نماذج اللغة الضخمة على سلامتها؟ تحليل جديد يغير اللعبة!

كيف يؤثر تعديل نماذج اللغة الضخمة على سلامتها؟ تحليل جديد يغير اللعبة!

أركايف للذكاءمنذ 1 شهر

MESA: تحسين سلامة نماذج Mixture-of-Experts من خلال الخبرة اللامركزية!

MESA: تحسين سلامة نماذج Mixture-of-Experts من خلال الخبرة اللامركزية!

أركايف للذكاءمنذ 1 شهر

تحديات السلامة في لغات الموارد المنخفضة: هل المشكلة في الأداء أم التمثيل؟

تحديات السلامة في لغات الموارد المنخفضة: هل المشكلة في الأداء أم التمثيل؟

أركايف للذكاءمنذ 1 شهر

درع قوي لضمان السلامة في التعلم المعزز: التطور الجديد!

درع قوي لضمان السلامة في التعلم المعزز: التطور الجديد!

أركايف للذكاءمنذ 1 شهر

المستقبل في الذكاء الاصطناعي: كيف تكشف الإشارات عن سلوك الرفض في نماذج اللغات الضخمة؟

المستقبل في الذكاء الاصطناعي: كيف تكشف الإشارات عن سلوك الرفض في نماذج اللغات الضخمة؟

أركايف للذكاءمنذ 1 شهر

SkillSafetyBench: تقييم أمان الوكلاء في مواجهة هجمات المهارات!

SkillSafetyBench: تقييم أمان الوكلاء في مواجهة هجمات المهارات!

أركايف للذكاءمنذ 1 شهر

إلينوي: تشريعات رائدة لضمان سلامة الذكاء الاصطناعي في أمريكا!

أخلاقيات الذكاء الاصطناعي

إلينوي: تشريعات رائدة لضمان سلامة الذكاء الاصطناعي في أمريكا!

وايردمنذ 1 شهر

ثورة في تقييمات الذكاء الاصطناعي: اكتشفوا تقنية LURE وتأثيرها المذهل!

ثورة في تقييمات الذكاء الاصطناعي: اكتشفوا تقنية LURE وتأثيرها المذهل!

أركايف للذكاءمنذ 1 شهر

تعلم المنهجية: كيف تعزز أمان نماذج الذكاء الاصطناعي بتقنيات جديدة!

تعلم المنهجية: كيف تعزز أمان نماذج الذكاء الاصطناعي بتقنيات جديدة!

أركايف للذكاءمنذ 1 شهر

الحرب الخفية في عالم الذكاء الاصطناعي: كيف يمكن لنماذج اللغة الكبيرة تجاوز يقظة الإنسان الإدراكية؟

الحرب الخفية في عالم الذكاء الاصطناعي: كيف يمكن لنماذج اللغة الكبيرة تجاوز يقظة الإنسان الإدراكية؟

أركايف للذكاءمنذ 1 شهر

اكتشاف المخاطر: GT-HarmBench يقيّم سلامة الذكاء الاصطناعي من خلال نظرية الألعاب

اكتشاف المخاطر: GT-HarmBench يقيّم سلامة الذكاء الاصطناعي من خلال نظرية الألعاب

أركايف للذكاءمنذ 1 شهر

CRAFT: تحوُّل ثوري في سلامة نظم الذكاء الاصطناعي بفضل التعلم من التمثيلات الخفية

CRAFT: تحوُّل ثوري في سلامة نظم الذكاء الاصطناعي بفضل التعلم من التمثيلات الخفية

أركايف للذكاءمنذ 2 شهر

تحذير من موظفين سابقين في OpenAI: سجلات أمان xAI قد تعرقل طرح SpaceX للاكتتاب العام!

أخلاقيات الذكاء الاصطناعي

تحذير من موظفين سابقين في OpenAI: سجلات أمان xAI قد تعرقل طرح SpaceX للاكتتاب العام!

وايردمنذ 2 شهر

← السابق2 / 4التالي →