في وقتنا الحالي، يعتبر قياس إبداع نماذج اللغات الضخمة (Large Language Models) من الأمور الحيوية لتطوير أساليب جديدة تعزز من هذه القدرة. في السنوات الأخيرة، تم الاعتماد بشكل متزايد على اختبارات الإبداع البشرية كوسيلة لقياس إبداع هذه النماذج. لكن، هل هذه الاختبارات فعالة حقاً في قياس الإبداع الآلي؟

في دراسة شاملة تناولت تأثير اختبارات الإبداع على تقييم إنجازات نماذج اللغات الضخمة، تم إجراء تحليل شامل لثلاثة مجالات رئيسية: الكتابة الإبداعية، التفكير المتباين، وتوليد الأفكار العلمية. أظهرت النتائج أن اختبار Divergent Association Task (DAT) وConditional DAT يمثلان الأفضل في قياس الكتابة الإبداعية والتفكير المتباين، بينما تختلف فعالية الاختبارات بشكل ملحوظ بحسب النوع المستهدف، مما يعني أنه لا توجد اختبار واحد يمكنه قياس جميع المجالات بفعالية.

لكن المفاجأة كانت في أن لا اختبار موجود يمكن أن يتنبأ بدقة بإمكانية توليد الأفكار العلمية. استجابة لذلك، تم تقديم اختبار Divergent Remote Association Test (DRAT)، الذي يقيم التفكير التبايني والتوافقي في أداة واحدة. هذا الاختبار هو الأول من نوعه الذي أثبت فعاليته كمنبئ رئيسي للقدرة على التفكير العلمي، فيما يظهر متانة عبر خيارات التصميم المختلفة.

تمثل هذه الدراسة خطوة مهمة نحو فهم أعمق للإبداع الآلي، إذ تشير النتائج إلى أن دمج أساليب قياس التفكير المتباين والتوافقي في اختبار واحد هو الأمر الحاسم لضمان دقة التنبؤات حول القدرة العلمية للأفكار. هذه الفكرة تفتح آفاقاً جديدة لاستكشاف الإبداع في الذكاء الاصطناعي، مما يعكس أهمية الابتكار في هذا المجال.