تعتبر الاختبارات التقليدية لمعايير الذكاء الاصطناعي عادةً غير كافية لتقييم كفاءتها الحقيقية في جوانب متعددة، خاصة عندما يتعلق الأمر بالحكم الذاتي. فقد تم تقديم معيار جديد يحمل اسم HiL-Bench (Human-in-the-Loop Benchmark) والذي يهدف إلى قياس مهارات الوكلاء في تحديد متى ينبغي عليهم طلب المساعدة.
تواجه الوكالات الذكية تحديات كبيرة عند معالجة مهام معقدة حينما تفتقر المعلومات إلى الدقة أو تكون غامضة. وفقًا للدراسة، ليس الفشل ناتجًا عن نقص القدرات بل بسبب الحكم السيء: فهم متى يجب أن يعملوا بشكل مستقل ومتى يجب أن يلجأوا إلى الطلب.
المعايير الحالية لا تأخذ في الاعتبار هذه الأنماط؛ حيث تقدم تعليمات دقيقة وتكتفي بتقييم دقة التنفيذ، مما يعني أن وكيلًا استطاع أن يتوصل إلى إجابة خاطئة لأحد المتطلبات سيكون له نفس النتيجة كوكيل آخر كان عليه أن يسأل للتأكد.
تركز HiL-Bench على تسليط الضوء على هذا الخلل، حيث يحتوي كل اختبار على معلومات مفقودة أو ambiguous requests أو معلومات متناقضة ينبغي أن تُكتشف من خلال الاستكشاف التدريجي بدلاً من الفحص المباشر.
تتعلق المقياس الأساسي، Ask-F1، بمعادلة هارمونيك تجمع بين دقة السؤال واسترجاع الحواجز، مما يعكس الصراع بين الإفراط في طلب المساعدة والتخمين الصامت.
أظهرت التحليلات أن هناك ثلاثة أنماط رئيسية في السعي للمساعدة: الاعتقادات الخاطئة الواسعة الثقة دون الكشف عن الفجوات، اكتشاف عدم اليقين ولكن مع استمرار الأخطاء، والتصعيد الواسع وغير الدقيق دون تصحيح ذاتي. وهذه الأنماط تؤكد على أن سوء طلب المساعدة هو عيب على مستوى النموذج وليس المهمة.
من المثير أن التدريب باستخدام مكافأة Ask-F1 أظهر أن الحكم عادةً ما يمكن تحسينه: حيث تحسن نموذج بحجم 32B في جودة طلب المساعدة ومعدل النجاح في المهام، مع تحسينات تنقل عبر المجالات. النموذج لا يتعلم استراتيجيات محددة لكل مجال، بل يتعلم كيفية اكتشاف عدم اليقين غير القابل للحل والتصرف بناءً على ذلك.
تعتبر هذه النتائج مثيرة للاهتمام، مما يؤكد أن الذكاء الاصطناعي يوجد أمامه مجال كبير للتطور في مهاراته.
ما رأيكم في هذا التطور المذهل في عالم الذكاء الاصطناعي؟ شاركونا في التعليقات.
هل يعرف الذكاء الاصطناعي متى يطلب المساعدة؟ إليكم الإجابة المدهشة!
قد تثير الذكاء الاصطناعي إعجابنا بقدراته، لكن هل يستطيع أن يعرف متى يتطلب الأمر المساعدة؟ دراسة جديدة تكشف عن ثغرة كبيرة في الحكم الذاتي للروبوتات، وطرق لتحسين قدرتها على طلب العون.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
