في عالم الذكاء الاصطناعي المستمر في التطور، يتناول البحث الجديد اختبار قدرة نماذج اللغات (Language Models) على المشاركة في العمليات الفلسفية من خلال استخدام الأمثلة المضادة. يُظهر البحث كيف يمكن لهذه النماذج إجراء تحليل متكرر وتطوير التعريفات عبر سلسلة من الأمثلة المضادة والإصلاحات.

تُعتبر عملية تحليل المفاهيم مركزية في المنهجية الفلسفية، حيث يتم اقتراح التعريفات وتطويرها عن طريق الأمثلة المضادة. وقد قام الباحثون باختبار أداء نماذج اللغات على مدى 20 مفهومًا وباستخدام الآلاف من دورات الأمثلة المضادة والتصحيح.

وقد أظهرت النتائج أن العديد من الأمثلة المضادة التي تولّدها النماذج قد قُدّرت بأنها غير صالحة من قبل البشر والخبراء، بينما قَبِلَ القاضي من نموذج اللغة حوالي ضعف العدد الذي تأكده البشر. ومع ذلك، كانت تقييمات صلاحية كل عنصر متسقة إلى حد ما بين البشر والنماذج.

الأكثر إثارة للاهتمام هو أن التكرار الموسع أنتج تعريفات أكثر طولًا، ولكن دون تحسين الدقة. كما أظهرت بعض المفاهيم مقاومة للتعريفات المستقرة بشكل عام. تشير هذه النتائج إلى أن نماذج اللغات يمكن أن تشارك في التفكير الفلسفي، ولكن الحلقة بين الأمثلة المضادة والإصلاح حققت عوائد متناقصة بسرعة، مما قد يوفر حالة اختبار مثمرة لفهم القدرة الفكرية العالية لهذه الأنظمة.