في عالم أصبح فيه تصنيف البيانات أمراً حيوياً، يبرز مفهوم المقارنة الثنائية كمعيار ذهبي للمهام التي تتطلب تقييماً ذاتياً. ولكن، تتطلب عملية التوصيف الواسعة عددًا هائلًا من المقارنات البشرية، وهو ما يعوق التقدم ويزيد من التكلفة. للتغلب على هذه التحديات، ظهرت تقنية جديدة تُعرف باسم Surprise-Guided MergeSort (SGS).

تعمل SGS على تحسين الكفاءة من خلال تحويل نموذج الفهم المرئي واللغوي (Vision-Language Model) إلى مُحدد أولوية، بدلاً من استبدال المقيّمين البشريين، حيث يسعى هذا النموذج لتحديد المقارنات التي تتطلب فعلاً حكمًا بشريًا.

يتكون إطار العمل من ثلاثة مكونات رئيسية:
1. **جدول MergeSort من الأسفل إلى الأعلى**: ينظم المقارنات ويوظف العلاقة الترانزيتيفية (transitivity) لتقليل عدد المقارنات.
2. **علامة المفاجأة المركّبة**: تجمع بين ثقة النموذج، الفجوة بين إلو، وتعدد الأصوات، لقياس غموض المقاربات.
3. **مُخصص الميزانية التكيفية**: يوجه الأزواج التي تحوي على مفاجآت كبيرة إلى البشر، بينما يتم أتمتة الأزواج ذات المفاجآت القليلة.

أظهرت الدراسات التي أجريت على ستة معايير متنوعة تشمل تشابه النصوص وتقييم جودة الصور، أن SGS تمكنت من تحديد وتخطي حتى 535 مقارنة غير مثمرة في الجلسة الواحدة.

بفضل هذه التقنية، حققت SGS تحسنًا في دقة التصنيف بمعدل يتراوح بين 6 إلى 12 نقطة بالمقارنة مع نموذج Active Elo، مع الحفاظ على نفس الميزانية الإجمالية.

تَظهر هذه النتائج كيف يمكن دمج مقاييس المفاجأة المستندة على نموذج الفهم المرئي مع الأساليب الخوارزمية، مما يوفر توازنًا موثوقًا بين الدقة والكفاءة عبر مجالات متعددة.