في عالم علم المواد، يمثل بناء وتعديل الهياكل الذرية أحد أكثر الخطوات إبداعًا، لكن هذه العملية تظل أقل أتمتة. ولتقييم قدرات نماذج اللغات الضخمة (Large Language Models) في هذه المهام، تم تقديم معيار جديد يسمى "اتوم وورلد". يأتي هذا المعيار ليعالج النقاط العمياء في المعايير الحالية التي تركز في الغالب على المهام الإدراكية أو المعتمدة على المعرفة.
يتضمن اتوم وورلد عشرة إجراءات أساسية تقع ضمن أربعة فئات نمذجة مستخدمة على نطاق واسع، مما يمنح الباحثين وسيلة موثوقة لتقييم أداء هذه النماذج. وجد الباحثون أن نموذج "كلود أوبس" (Claude Opus) الإصدار 4.6 يحقق أداءً أفضل بشكل عام. ومع ذلك، تتناقص معدلات النجاح بشكل ملحوظ مع زيادة التعقيد في نمذجة الهياكل، حيث لوحظت معدلات نجاح منخفضة للغاية بحدود 12% للعمليات المتعلقة بالعلاقات المكانية المعقدة.
تشير هذه النتائج إلى أن نماذج اللغات الضخمة المعاصرة تكون أكثر ملاءمة كمساعدين في نمذجة الهياكل، بدلاً من أن تُعتبر وكلاء علميين مستقلين. بالإضافة إلى ذلك، يُمكن أن تكون "اتوم وورلد" ساحة اختبارية لتطوير نماذج مستقبلية ذات وعي هيكلي، بما في ذلك التعلم المعزز (Reinforcement Learning) والنهج الوكيلية (Agentic Approaches).
ويبقى السؤال، كيف يمكن أن تغير هذه النتائج من مستقبل أبحاث علم المواد؟ شاركونا آراءكم في التعليقات!
اتوم وورلد: معيار ثوري لتقييم التفكير المكاني في نماذج اللغات الضخمة بالمواد البلورية
تمثل اتوم وورلد معياراً رائداً لتقييم كفاءة نماذج اللغات الضخمة في تعديل الهياكل الذرية، مما يعكس تحديات علم المواد. تشير النتائج إلى أن هذه النماذج أكثر ملاءمة كمساعدين في علم المواد بدلاً من أن تكون علماء مستقلين.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
