🏷️ #سلامة الذكاء الاصطناعي

72 مقال

اختراق جديد في الذكاء الاصطناعي: نظام GPT-Red لتحقيق التحسين الذاتي والأمان المتين!

اختراق جديد في الذكاء الاصطناعي: نظام GPT-Red لتحقيق التحسين الذاتي والأمان المتين!

مدونة أوبن إيه آيمنذ 5 يوم

SPQR: المعيار الثوري لتقييم سلامة نماذج تحويل النص إلى صورة!

SPQR: المعيار الثوري لتقييم سلامة نماذج تحويل النص إلى صورة!

أركايف للذكاءمنذ 6 يوم

إيجاد الشهادات الموضوعية للذكاء الاصطناعي: استكشاف جديد في قوة الشبكات العصبية المتعددة الطبقات

إيجاد الشهادات الموضوعية للذكاء الاصطناعي: استكشاف جديد في قوة الشبكات العصبية المتعددة الطبقات

أركايف للذكاءمنذ 7 يوم

رحيل رئيس قسم المستقبل في OpenAI: ماذا يعني ذلك للذكاء الاصطناعي؟

رحيل رئيس قسم المستقبل في OpenAI: ماذا يعني ذلك للذكاء الاصطناعي؟

وايردمنذ 12 يوم

أوسترا-II: ثورة جديدة في تحقيق السلامة في نماذج اللغات الضخمة!

نماذج لغوية

أوسترا-II: ثورة جديدة في تحقيق السلامة في نماذج اللغات الضخمة!

أركايف للذكاءمنذ 13 يوم

ابتكار جديد في مجال تعلم التعزيز: تقنية TraCeS لضمان السلامة في الذكاء الاصطناعي!

ابتكار جديد في مجال تعلم التعزيز: تقنية TraCeS لضمان السلامة في الذكاء الاصطناعي!

أركايف للذكاءمنذ 19 يوم

السلامة في الذكاء الاصطناعي: هل هي خاصية معرفية أم سلوكية؟

السلامة في الذكاء الاصطناعي: هل هي خاصية معرفية أم سلوكية؟

أركايف للذكاءمنذ 20 يوم

هل يمكن تحقيق التوافق في الذكاء الاصطناعي العام؟ فهم الحدود الرياضية المعقدة!

هل يمكن تحقيق التوافق في الذكاء الاصطناعي العام؟ فهم الحدود الرياضية المعقدة!

أركايف للذكاءمنذ 20 يوم

آثار تحليل الزوجي لتقنية الكم ودرجة حرارة العينات على سلامة نماذج اللغات الضخمة: دراسة مثيرة

آثار تحليل الزوجي لتقنية الكم ودرجة حرارة العينات على سلامة نماذج اللغات الضخمة: دراسة مثيرة

أركايف للذكاءمنذ 20 يوم

تحكم بالأمان: تعزيز السلامة في نماذج الفيديو للذكاء الاصطناعي دون تدريب

تحكم بالأمان: تعزيز السلامة في نماذج الفيديو للذكاء الاصطناعي دون تدريب

أركايف للذكاءمنذ 1 شهر

تحديات التوافق في الذكاء الاصطناعي: هل تتكيف نظرية الإجماع الكلاسيكية مع الوكلاء ذات اللغة الضخمة؟

تحديات التوافق في الذكاء الاصطناعي: هل تتكيف نظرية الإجماع الكلاسيكية مع الوكلاء ذات اللغة الضخمة؟

أركايف للذكاءمنذ 1 شهر

كشف المستور: تقييم سلامة العملاء ضد هجمات التفكيك مع DECOMPBENCH

كشف المستور: تقييم سلامة العملاء ضد هجمات التفكيك مع DECOMPBENCH

أركايف للذكاءمنذ 1 شهر

مخاطر جديدة في تفاعلات متعددة: كيف نضمن أمان الوكلاء باستخدام الأدوات؟

مخاطر جديدة في تفاعلات متعددة: كيف نضمن أمان الوكلاء باستخدام الأدوات؟

أركايف للذكاءمنذ 1 شهر

فضيحة فصل مهندس في xAI يكشف عواقب سلامة الذكاء الاصطناعي قبل IPO تاريخي!

أخلاقيات الذكاء الاصطناعي

فضيحة فصل مهندس في xAI يكشف عواقب سلامة الذكاء الاصطناعي قبل IPO تاريخي!

تيك كرانشمنذ 1 شهر

كيف تعزز SHAPO الأمان في تدريب الوكلاء الاصطناعيين؟ استكشاف مُحسّن لسياسات الذكاء الاصطناعي!

كيف تعزز SHAPO الأمان في تدريب الوكلاء الاصطناعيين؟ استكشاف مُحسّن لسياسات الذكاء الاصطناعي!

أركايف للذكاءمنذ 1 شهر

تحطيم قيود سلوك الآلات: الابتكار في تقييم الأنظمة متعددة الوكلاء

تحطيم قيود سلوك الآلات: الابتكار في تقييم الأنظمة متعددة الوكلاء

أركايف للذكاءمنذ 1 شهر

هل يمكن لنماذج اللغات الكبيرة (LLMs) تقييم السلامة بشكل موثوق؟ استكشاف تاريخ التقييمات الصارمة!

هل يمكن لنماذج اللغات الكبيرة (LLMs) تقييم السلامة بشكل موثوق؟ استكشاف تاريخ التقييمات الصارمة!

أركايف للذكاءمنذ 1 شهر

VESTA: إطار مبتكر لتوليد السيناريوهات وتقييم السلامة للوكالات الذكية

VESTA: إطار مبتكر لتوليد السيناريوهات وتقييم السلامة للوكالات الذكية

أركايف للذكاءمنذ 1 شهر

ثغرات الأمان السلوكي في نماذج الذكاء الاصطناعي: هل يكفي تقييم السلوك؟

ثغرات الأمان السلوكي في نماذج الذكاء الاصطناعي: هل يكفي تقييم السلوك؟

أركايف للذكاءمنذ 1 شهر

أسرار قيادة التفعيل: كيف تثير نماذج اللغة الكبيرة (LLMs) سلوكيات غير متوقعة؟

أسرار قيادة التفعيل: كيف تثير نماذج اللغة الكبيرة (LLMs) سلوكيات غير متوقعة؟

أركايف للذكاءمنذ 1 شهر

1 / 4التالي →