في عالم العلوم الحديثة، يتطلب تحديد مؤشرات ميلر (Miller indices) من أنماط الأشعة السينية (XRD) مهارات لم يتم اختبارها من قبل بواسطة المعايير المتعددة الأنماط الحالية. إذ يتعين على النموذج قراءة موقع القمة الضيق من منحنى علمي واحد، ثم ربط تلك الملاحظة بعملية حسابية بلورية متعددة الخطوات. في هذا السياق، تم تقديم أداة CrystalXRD-Bench، وهي معيار مكون من 250 عينة مستمدة من 10 قواعد بيانات بلورية عامة، مُركزاً على مهمة واحدة: استعادة المجموعة الكاملة من HKLs التي تسهم في أعلى قمة كثافة في نمط XRD.
تقوم كل عينة بمزاوجة صورة XRD المُعَدَّة مع النص المصدر و صيغة المواد الكيميائية، مما يتيح فحص الأخطاء البصرية وأخطاء التفكير جنباً إلى جنب. تم تقييم سبعة نماذج للرؤية واللغة (Vision-Language Models)، حيث حقق أفضل نموذج (GPT-5.4) نتيجة Jaccard تبلغ 0.5888 مع معدل تطابق دقيق يصل إلى 37.6%. ومع ذلك، ظل ستة من النماذج السبعة تحت مستوى Jaccard 0.50، ما يعني أن المهمة لا تزال بعيدة عن الحل.
تشير أنماط الأخطاء إلى تباين منهجي: فالحالات ذات القمتين تكون هشة بشكل خاص، وتحوز النموذج المتطلع لرفع التغطية من خلال التنبؤ الزائد بـ HKLs. بالإضافة إلى ذلك، لا يغلق الوصول إلى نص CIF الفجوة في الحساب البلوري. علاوةً على تصنيفات النماذج، يعرف المعيار الشروط التي تفشل فيها نماذج VLM الحالية على الأشكال العلمية الكمية. جدير بالذكر أن جميع البيانات وشفرة التقييم ستكون متاحة للجمهور، مما يفتح الباب لنقاشات أوسع حول تحسين الأداء في هذا المجال العلمي المتقدم.
إطلاق CrystalXRD-Bench: معيار جديد لتقييم نماذج الرؤية واللغة في تحديد قمة XRD لمواد بلورية متنوعة
تم الكشف عن CrystalXRD-Bench كأداة قياسية جديدة لتقييم الأداء الفريد لنماذج الرؤية واللغة في علم البلورات. هذه الأداة تهدف إلى تحسين دقة تحديد القمم في الأنماط الكريستالية المعقدة.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
