مع تقدم تكنولوجيا الذكاء الاصطناعي، تُظهر نماذج اللغة الكبيرة (Large Language Models) تحسناً ليس بشكل موحد، بل بطريقة متعرجة ومليئة بالتحديات. فهل يمكن لهذه الديناميكية أن تُقودنا إلى ابتكارات علمية جديدة؟

في دراسة حديثة، قام الباحثون بتحليل هذه العوائق غير المتجانسة في الإبداع العلمي بالتحديد، وأطلقوا معيار SciAidanBench، الذي يتضمن مجموعة من الأسئلة العلمية المفتوحة لقياس إبداع نماذج اللغة الكبيرة. اعتماداً على مدى استجابة هذه النماذج، يتم قياس جودة الأفكار الفريدة التي يمكنها توليدها في سياق علمي.

عند تقييم 19 نموذجاً أساسياً عبر 8 مقدمي خدمات (بما في ذلك 30 نموذجاً متغيراً بما في ذلك الإصدارات الخاصة بالتفكير)، وجد الباحثون أن عدم التماثل يتمثل على عدة مستويات. أولاً، في مقارنة بين الإبداع العلمي والإبداع العام، لم تنتقل التحسينات من الإبداع العام بشكل متساوي إلى الإبداع العلمي، مما أظهر اختلافات واضحة في القدرات بين النماذج.

ثانياً، عند مستوى التوجيه، لا تتحسن النماذج الأكثر قوة بشكل متساوي، بل تظهر تقلبات عالية، حيث تأتي فترات من الإبداع في بعض الأسئلة بينما تكون فيها الأداءات محدودة في أسئلة أخرى.

ثالثاً، على المستوى المجالي، تظهر النماذج الفردية نقاط قوة متفاوتة عبر مجالات علمية فرعية، مما يعكس تنوع القدرات الداخلية. ومع ذلك، أظهر الباحثون أن هذا عدم التماثل يمكن استغلاله. من خلال استكشاف آليات مثل حساب الاستدلال، وتجميع المعرفة، وتبادل الأفكار، يمكن دمج النماذج بطريقة فعالة لتكوين مجموعات من النماذج الفرعية التي تتفوق على أي نموذج فردي.

تضع نتائج هذه الدراسة عدم التماثل كعنصر ليس كعائق، بل كمورد يمكن استغلاله. إذا تم فهم هذا السلوك، يمكن أن يؤدي إلى تعزيز الإبداع العلمي المعتمد على نماذج اللغة الكبيرة. هل أنتم مستعدون لاستكشاف هذا الإمكان؟