في عالم التقييم الذكي، يتطلب العديد من التطبيقات تحقيق توقعات مطلقة، لكن القيام بمقارنات زوجية يمكن أن يوفر هدف تعلم أبسط. لهذا السبب نقدم لكم تقنية Pair2Score، وهي إطار عمل ذو مرحلتين ينقل المقارنات الزوجية إلى تقييمات مطلقة من خلال تعديل فعّال لنموذج LLaMA.

في المرحلة الأولى، يتم تدريب مصنف سيامي توجيهي على المقارنات الزوجية المستخلصة من الملصقات المطلقة. بينما المرحلة الثانية تختص بتدريب متنبئ مطلق باستخدام استراتيجيات نقل متعددة سواء كانت باردة (warm-start) أو دمج الخصائص (embedding-fusion).

تم تقييم هذا النظام الجديد وفق سمات متوافقة مع معايير تقييم المقالات الآلية (Automated Essay Scoring - AES) مثل القواعد النحوية، المفردات، والنحو، وذلك عبر بروتوكول شامل يتضمن خمسة أضعاف مع تغيير عشوائي للبذور.

نتائجنا تظهر أن أفضل النسخ المدربة بالأبعاد الزوجية تحسن من قيمة الكابا الموزونة التربيعية (Quadratic Weighted Kappa - QWK) مقارنة بالأساسيات المعتمدة على التقييم المطلق عبر جميع السمات الثلاث. لكن ليس كل أنماط النقل تأتي بفائدة: حيث إن المرحلة الزوجية الواحدة تنقل النتائج بشكل أكثر موثوقية مقارنة بالتدريب المطول.

في النهاية، لا يتحدد مدى استفادة التقييمات اللاحقة من خلال إدخال مرحلة زوجية فقط، بل يعتمد أيضاً على تكوينات النقل وكيفية تسخيرها لتحقيق نتائج مثمرة في التقييم الآلي.