في عالم الذكاء الاصطناعي، يتم استخدام نماذج اللغات الكبيرة (LLMs) كحكام لتقييم السلامة على نطاق واسع. لكن، هل يمكن الاعتماد عليها حقًا؟ دراسة جديدة تُظهر أن تقييمات هذه النماذج غالبًا ما تتأثر بمعلومات سياقية، مما يعقد قدرتها على تقديم تقييم دقيق لمدى سلامة المحتوى المعروض.

على الرغم من أهمية هذه النماذج، فإن تقييمات السلامة التي تقوم بها عادة ما تكون محدودة، حيث تركز فقط على توافقها مع آراء البشر في معايير بسيطة وثابتة. لهذا السبب، قامت الأبحاث الأخيرة بإلقاء الضوء على خاصيتين مهمتين لنماذج اللغات الكبيرة كحكام؛ قابلية تأثرها بالمعلومات السياقية ومرونتها في التكيف مع تعريفات مختلفة للسلامة.

تم تقييم قدرات هذه النماذج في الحكم على السلامة من خلال تجربة شاملة. حيث أظهرت النتائج أن نماذج اللغات الكبيرة يمكن أن تستوعب معلومات جديدة، ولكنها نادرًا ما تعدل تقييماتها إذا كانت المعلومات الجديدة أو تعريفات السلامة متعارضة مع المعلومات السابقة التي تم تدريبها عليها.

تعتبر هذه القيود مثيرة للقلق، خاصةً عندما يتعلق الأمر بتمكين الذكاء الاصطناعي بشكل أكثر موثوقية في المجالات الحساسة، مثل الرعاية الصحية أو المحتوى الرقمي. فهل تعتقد أن هناك إمكانية لتحسين قدراتها في المستقبل؟ أم أن الاعتماد على نماذج مثل هذه يحمل مخاطرة كبيرة؟