في عصر الذكاء الاصطناعي، تزداد أهمية الكفاءات الأخلاقية والمعيارية في الأنظمة الذكية (Smart Systems)، خاصةً مع انتشار النماذج اللغوية الضخمة (Large Language Models) ونظم الوكلاء (Agentic Systems) في البيئات الاجتماعية. وعلى الرغم من ذلك، نلاحظ أن الأساليب الحالية تقيّم الحكم المعياري فقط في النصوص أو تقلل من مفهومه إلى اختيار من مجموعة ثابتة من الخيارات. هنا تأتي أهمية نظام NoRA.

نظام NoRA هو معيار جديد يركز على الرصد البصري من منظور الشخص الأول، حيث يتطلب من النماذج تأمين أفعال قوية ومبررة من خلال شبكة واضحة تعتمد على الحقائق والأسباب. يتكون هذا المعيار من 1,420 مقطع فيديو معنون، تنقسم إلى مجموعات HumanGold-190 و LLMSilver-1230. يتم تقييم كل حالة من خلال تقارب الإجراءات والأرضية الواقعية، مما يولد نقطة تقييم واحدة تُعرف بالمعقولية المبنية على السياق.

قمنا باختبار 12 نظاماً متعدد الوسائط تحت أوضاع توجيه مباشرة ومنظمة، لنجد أن النماذج اللغوية البصرية (Visual Language Models) قد استطاعت بشكل متكرر استرجاع أفعال معقولة وحقائق مشهدية ذات صلة، ولكنها تواجه صعوبة في بناء مساحة الأفعال المعقولة بالكامل وترBind الإجراءات المحددة بالأدلة الصحيحة.

تعد NoRA خطوة هامة نحو قياس الفجوة بين قدرة النموذج على اختيار إجراء وفي نفس الوقت تبرير الإجراء المناسب استناداً إلى الأسباب الظاهرة. توفر هذه الخطوة تقدماً كبيراً في تعزيز الفهم العملي لكيفية اتخاذ القرارات الأخلاقية بمشاركة البيانات البصرية المتاحة.