في عالم الذكاء الاصطناعي المتطور، تظهر الحاجة بشكل متزايد إلى أساليب متقدمة لتقييم النماذج وتحسين أدائها. في هذا الاطار، تُقدم LLM-PeerReview، وهي طريقة مبتكرة لتجميع نماذج اللغات الضخمة (Large Language Models) بطريقة غير خاضعة للإشراف، حيث تسعى لاختيار أفضل الإجابات من عدة خيارات يتم توليدها من نماذج متعددة، وذلك من خلال استغلال الحكمة الجماعية لهذه النماذج المختلفة.

يتضمن نظام LLM-PeerReview ثلاث مراحل رئيسية:
1. **التقييم**: تعتمد هذه المرحلة على تقنية LLM-as-a-Judge، حيث يتم الاستخدام المتعدد لنماذج اللغات الضخمة المتاحة لتقييم كل إجابة.
2. **التحليل**: يمكن تطبيق استراتيجية متوسطة بسيطة أو استخدام خوارزمية معتمدة على نماذج الرسوم البيانية لاستنتاج الحقيقة، لتجميع الدرجات المتعددة وإنتاج نتيجة نهائية لكل إجابة.
3. **الاختيار**: بناءً على الدرجات المقدمة، يتم اختيار الإجابة الحاصلة على أعلى تقييم باعتبارها أفضل استجابة شاملة.

تمتاز LLM-PeerReview ببساطتها المفاهيمية وقوتها التجريبية، حيث أظهرت النتائج عبر أربعة مجموعات بيانات أنها تتفوق على النموذج المتقدم Smoothie-Global بفارق يتراوح بين 6.9% و7.3%، مما يعكس كفاءتها عبر مهام متنوعة تشمل استرجاع المعلومات، التفكير الرياضي، واتباع التعليمات.

ما رأيكم في هذا التطور المثير؟ شاركونا في التعليقات.