في عالم سريع التطور حيث تعزز نماذج اللغات العملية (Language Models) الذكاء الاصطناعي في العلوم، لا يزال هناك حاجة ملحة لتحقيق أعلى مستويات الدقة في المهام العلمية. وهنا يأتي الابتكار الجديد: D3-Gym.
D3-Gym هو أول مجموعة بيانات تُنشأ تلقائيًا وتتضمن بيئات قابلة للتحقق تم تصميمها لدعم الاكتشاف العلمي القائم على البيانات. وقد تم استنباط 565 مهمة من 239 مستودعًا علميًا عبر أربعة تخصصات، حيث تم تجهيز كل مهمة بتعليمات باللغة الطبيعية وبيئة قابلة للتنفيذ مع الاعتمادات المثبتة مسبقًا، بالإضافة إلى معاينات لمجموعات البيانات والمخرجات الفنية.
ماذا يعني ذلك للباحثين؟ يعني أنه لم يكن من الأسهل من قبل الوصول إلى الموارد التي يتم قياس دقتها بواسطة أدوات تحقق علمية. حيث أظهرت تقييمات rigor أن سكريبتات التقييم لدينا تحقق 87.5% توافقًا مع المعايير المعيارية البشرية، مما يشير إلى موثوقية علمية قوية.
علاوة على ذلك، أثبت التدريب على المسارات المستخلصة من D3-Gym تحقيق مكاسب كبيرة ومستمرة عبر نماذج Qwen3 بمختلف أحجامها، حيث ارتفعت دقة نموذج Qwen3-32B بمقدار 7.8 نقطة، مما يقلل الفجوة مع النماذج الخاصة القوية.
دليل شامل تحت تصرفكم: يمكنكم الاطلاع على جميع مكونات D3-Gym، بما في ذلك البيئات، وإجراءات الإنشاء، والمسارات، والنماذج عبر رابط GitHub الخاص بهم.
ثورة جديدة في اكتشاف البيانات: D3-Gym يفتح آفاقاً جديدة للبيانات العلمية!
تمثل D3-Gym طفرة نوعية في بناء بيئات قابلة للتحقق لدعم اكتشاف البيانات العلمية. بإقدامه على توفير 565 مهمة مستمدة من 239 مستودعًا علميًا، يتيح هذا الابتكار الفرصة للباحثين لتعزيز أبحاثهم بموارد موثوقة.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
