تسارع وتيرة تقنيات توليد النصوص لم يكن مقروناً فقط بالقدرات المتزايدة لنماذج الذكاء الاصطناعي، بل أيضًا بنمو الاهتمام في كيفية كشف النصوص التي أنتجتها الآلات. في هذا السياق، تعد القدرة على التمييز بين النصوص التي كتبها البشر وتلك التي ولّدتها نماذج الذكاء الاصطناعي أمرًا بالغة الأهمية. وعند دراسة أنظمة الكشف عن النصوص الإنجليزية، تظهر تحيزات قد تؤدي إلى تأثيرات سلبية على فئات معينة من المجتمع.

في دراسة حديثة، قام الباحثون بجمع مجموعة من المقالات الدراسية الخاصة بالطلاب وقاموا بتقييم 16 نظام كشف مختلف وفق أربعة جوانب:
1. الجنس
2. العرق/الأصل الإثني
3. حالة المتعلم غير الناطق باللغة الإنجليزية (ELL)
4. الوضع الاقتصادي

باستخدام نماذج مبنية على الانحدار، قام الباحثون بتقييم تأثيرات هذه الجوانب، ووجدوا أن التحيزات موجودة، ولكنها تختلف بشكل عام بين الأنظمة. وأهم المُكتشفات تتلخص في:
- بعض النماذج تميل بشكل غير عادل إلى تصنيف نصوص الفئات المستضعفة على أنها مولدة آليًا.
- المقالات المكتوبة من قبل الطلاب الذين يدرسون اللغة الإنجليزية (ELL) كانت أكثر عرضة للتصنيف على أنها آلية.
- نصوص الطلاب ذوي الوضع الاقتصادي المنخفض كانت أقل احتمالًا للتصنيف كمولدة آليًا.
- المقالات غير المكتوبة من قبل طلاب عرقهم غير أبيض كانت تُصنف بشكل غير متناسب كنصوص مولدة آليًا مقارنة بنظرائهم البيض.

على الرغم من أن البشر عموماً أدوا بشكل سيء في مهام الكشف، لم يظهروا أي تحيزات واضحة في الجوانب المدروسة. هذه النتائج تثير التساؤل حول كيفية تطبيق هذه النماذج في العالم الواقعي، مما يستدعي وضع استراتيجيات جديدة لتمكين الكشف العادل والموثوق عن النصوص.