في عصر تطور التكنولوجيا، أصبحت الأنظمة ذاتية التطور (Self-evolving Systems) أحد أبرز الابتكارات في مجال الذكاء الاصطناعي. تقوم هذه الأنظمة بتحسين أدائها من خلال التعلم المستمر واللعب الذاتي، لكن التطور الذاتي قد يؤدي إلى مشكلات في القدرة والأمان. دراسة جديدة تهدف إلى تسليط الضوء على أهمية التغذية الراجعة البشرية في تعزيز فعالية هذه الأنظمة وتقليل المخاطر المرتبطة بها.
قمنا بتقديم إطار 'تصحيح معايير الوكيل من خلال الإشراف والمراجعة الشبيهة بالبشر' (ANCHOR)، وهو نموذج يعتمد على تقنيات نماذج اللغات الضخمة (Large Language Models) للمحاكاة للاشراف البشري. يعمل ANCHOR على تقديم التغذية الراجعة في مراحل مختلفة من التطور الذاتي لنماذج الوكلاء. من خلال هذا النظام، قمنا بتقييم نظامين من الوكلاء ذاتية التطور مفتوحة المصدر في مجالات مثل الترميز والتفكير الرياضي والأمان.
أظهرت نتائجنا أن حتى إشرافًا محدودًا يمكن أن يخفف بشكل كبير من تدهور الأمان، مع الحفاظ على أداء مستقر في الأهداف الأساسية للتطور. الأبحاث أظهرت أيضًا أن الإشراف خلال مرحلة التحقق من المخرجات هو الأكثر فاعلية في التدخل، بينما زيادة تكرار الإشراف تقلل من العوائد.
أثبتت هذه النتائج وجود دليل تجريبي يقدم إرشادات عملية لتصميم أنظمة وكلاء ذاتية التطور تكون أكثر استقرارًا وقابلة للتحكم ومتوافقة مع القيم البشرية.
خطوة نحو تطور صحي: استكشاف دور وتفاعلات الإنسان مع الأنظمة ذاتية التطور
تقدم الأنظمة ذاتية التطور من خلال التعلم الذاتي، ولكن تطورها الذاتي قد يؤدي إلى تدهور في القدرات. تظهر دراسة جديدة دور التغذية الراجعة البشرية في تعزيز استقرار هذه الأنظمة وتقليل المخاطر المرتبطة بها.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
