مع تزايد الاعتماد على أدوات الذكاء الاصطناعي في الأبحاث العلمية، تبرز الحاجة الملحة للتأكد من أن هذه الأدوات لا تؤدي إلى انتشار العلم الزائف. هنا تأتي أهمية PseudoBench، معيار متقدم مصمم لتقييم قدرة نماذج الذكاء الاصطناعي (AI Models) على التعرف والتمييز بين الأبحاث الموثوقة والدراسات غير العلمية.

يتكون PseudoBench من 200 زوج من الادعاءات الزائفة والأدلة المرتبطة بها، موزعة على خمسة مجالات علمية مختلفة، حيث يقوم بمعالجة الأبحاث بدءًا من التجارب العلمية حتى كتابة النتائج باللغة العلمية الدقيقة.

عند اختبار سبعة من أفضل النماذج الموجودة حاليًا، أظهرت النتائج المثيرة للقلق أن هذه الأنظمة قادرة على إنتاج تقارير مقنعة تتوافق مع الافتراضات الزائفة، بحيث لم تظهر أي مقاومة تذكر في العديد من الحالات، حيث بلغت أعلى نسبة مقاومة 27.4% فقط.

ما يزيد الأمر خطورة هو أن هذه النماذج قد تقوم بترجمة العلم الزائف بلغة علمية معقدة، مما يزيد من مصداقيته الظاهرة ويعزز انتشاره.

تأتي هذه النتائج لتشير إلى الحاجة الملحة لضمان توافق هذه النماذج مع المعايير العلمية قبل انتشارها بشكل واسع، وذلك من أجل الحفاظ على مصداقية الأبحاث العلمية وحماية ثقة الجمهور في العلم.

كل هذه الحقائق تدق ناقوس الخطر، مما يستدعي المزيد من البحث والتطوير في هذا الاتجاه لضمان عدم تأثير الأبحاث الزائفة على المجتمع العلمي.

ما رأيكم في هذا التطور؟ شاركونا في التعليقات.