في الآونة الأخيرة، اتخذت عدد من المؤتمرات والدوريات العلمية سياسات صارمة تمنع استخدام نماذج اللغات الضخمة (Large Language Models) من قبل مراجعي الأقران، باستثناء استخدامها في تحسين، وإعادة صياغة، وتصحيح القواعد اللغوية للمراجعات المكتوبة بصورة بشرية. لكن، هل هذه السياسات فعلاً قابلة للتنفيذ؟

للإجابة عن هذا السؤال، قام الباحثون بتجميع مجموعة بيانات تشمل مراجعات للأقران تحاكي مستويات متعددة من التعاون بين البشر والذكاء الاصطناعي. وتم تقييم خمسة من أحدث أنظمة الكشف عن المحتوى، بما في ذلك نظامين تجاريين. كشف التحليل أن جميع أدوات الكشف ارتكبت أخطاء في تصنيف نسبة غير بسيطة من المراجعات المحسّنة بواسطة نماذج اللغات الضخمة على أنها مولّدة بواسطة الذكاء الاصطناعي، مما يعرض المراجعين لخطر الاتهام الزائف بسوء السلوك الأكاديمي.

كما تم التحقيق في ما إذا كانت الإشارات الخاصة بمراجعة الأقران، مثل الوصول إلى مخطوطة الورقة والنطاق المقيد للكتابة العلمية، يمكن الاستفادة منها لتحسين الكشف. على الرغم من أن دمج هذه الإشارات يحقق مكاسب قابلة للقياس في بعض الإعدادات، إلا أنه تم التعرف على قيود في كل نهج، وكشفت النتائج عن عدم توفر دقة كافية لاكتشاف استخدام الذكاء الاصطناعي في مراجعات الأقران. وبالتالي، تشير نتائجنا إلى أن التقديرات العامة الأخيرة لاستخدام الذكاء الاصطناعي في مراجعات الأقران عبر استخدام أدوات كشف الذكاء الاصطناعي يجب أن تُفسر بحذر، حيث أن الأدوات الحالية تميل إلى تصنيف المراجعات المختلطة (المخرجات التعاونية بين البشر والذكاء الاصطناعي) على أنها مولّدة بالكامل بواسطة الذكاء الاصطناعي، مما قد يضخم من مدى انتهاكات السياسات.

في ضوء هذه النتائج، يبقى السؤال قائمًا: هل ستتمكن الأوساط الأكاديمية من وضع سياسات فعالة لضمان النزاهة الأكاديمية؟ تابعونا لمزيد من التحديثات المعنية بتطورات الذكاء الاصطناعي في البحث العلمي.