في عالم الرياضيات الذي يتسم بالتعقيد، يبادر مشروع Mathswitch بالعمل على تصنيف المفاهيم الرياضية استنادًا إلى سجلات مستوردة من مصادر موثوقة مثل ويكي البيانات (Wikidata) وويكيبيديا (Wikipedia) وMathWorld. المشروع مفتوح المصدر، ويهدف إلى ربط السجلات التي تشير إلى نفس المفهوم دون إعادة تنظيم المحتوى القائم، مما يضمن أن كل مصدر يحتفظ بهيكله الخاص.
يركز المشروع حاليًا على استيراد بيانات المفاهيم من ويكي البيانات وما يرتبط بها من موارد، مع خطط للتوسع إلى مصادر إضافية وتعزيز ربط المفاهيم. نظرًا لأن مجموعة المفاهيم تُقدَّر من خلال استعلامات على الرسم البياني المُحرر جماعيًا في ويكي البيانات، فإن البيانات المستوردة قد تحتوي على معلومات مضللة: حيث قد تكون بعض العناصر غير رياضية، بينما قد تكون أخرى غامضة.
في ورقة بحثية حديثة، تم اختبار فعالية فرق تصويت من نماذج اللغات الضخمة (LLM) لتحسين تصنيف هذه البيانات ونفلها من الضجيج. كانت الطريقة المستخدمة تعتمد على تقييم عناصر ويكي البيانات التي تحتوي على معرفات معروفة من MathWorld كتحكم إيجابي، لدراسة كيفية تغير التصنيف عند إزالة معرفات قاعدة البيانات من السياق. بالإضافة إلى ذلك، تم فحص الحالات التي تعارض فيها الحكام آراء MathWorld، وتم تقسيم هذه الاختلافات إلى ثلاث فئات: أوصاف مفرطة التعميم، انحياز نطاق ضيق، ومطابقات النطاق التحريري، مما يشير إلى استراتيجيات إعادة معالجة مختلفة.
إن استخدام فرق تصويت من نماذج اللغات الضخمة ليس مجرد اتجاه تكنولوجي، بل يمثل خطوة مهمة نحو تحسين جودة المعلومات العلمية وتحقيق دقة أعلى في البيانات الرياضية. فما رأيكم في أهمية هذا التوجه؟ شاركونا آراءكم في التعليقات!
تصنيف المفاهيم الرياضية باستخدام فرق تصويت نماذج اللغات الضخمة في مشروع Mathswitch
يستعرض مشروع Mathswitch كيفية استيراد وتصنيف البيانات الرياضية من مصادر متعددة باستخدام نماذج اللغات الضخمة. يتم اختبار فعالية تصنيف هذه البيانات لضمان دقتها في مواجهة المعلومات المضللة.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
