في عالم الذكاء الاصطناعي، يعد قياس تنوع النتائج الإبداعية أمرًا جوهريًا لفهم كيف يمكن للنماذج أن تتطور بعد عمليات التدريب. فما هو الجديد في هذا المجال؟ نقدم اليوم منهجية مبتكرة لقياس التنوع باستخدام التعلم ضمن السياق، وهو ما يعرف بمقياس "Decan" (D_{Ca_n})، حيث يتم حسابه وفق المعادلة $D_{Ca_n} = C imes a_n$.
تقوم هذه الطريقة على الحصول على درجة لكل بايت استنادًا إلى الاحتمالات اللوجستية لكل توكن، وذلك بتمرير واحد للنموذج الأساسي θ، دون الحاجة إلى نموذج خاص أو مجموعة مرجعية أو حتى تسميات بشرية. يعتمد هذا النموذج الجديد على نظرية المعلومات، ويستفيد من تعلم نموذج اللغة للكشف عن مجموعة واسعة من التشابهات بين مدخلات متعددة، مما يلغي الحاجة إلى تدريب نموذج مخصص لذلك.
وتعتبر ميزة هذا المنهجية أنها تقيم العينات التي يصنعها الذكاء الاصطناعي إلى جانب ردود الكتابة البشرية، حيث يُنظر إلى التنوع كخاصية تتعلق بالاستجابات والمحفزات ونموذج التقييم.
طبقًا لمعيار McDiv القائم على البشر والذي أعده Tevet وBerant، فقد سجل مقياس "D_{Ca_n}" قيمة OCA 0.846 في مجموعة prompt_gen، مما يجعله يتفوق على أقوى خط أساسي عصبي معروف (SentBERT) الذي سجل 0.897. ومع تقدم مراحل التدريب، لوحظ انخفاض تدريجي لمقياس "D_{Ca_n}" عبر مراحل النموذج الأساسية لـ SFT، DPO، وRLVR، مما يمكننا من الكشف عن نوع فقدان التنوع الذي يهتم به التطبيقات الإبداعية.
إن هذه الابتكارات ستكون لها تأثيرات كبيرة على كيفية تقييم الذكاء الاصطناعي للإبداع والأداء، لذا فإن فهم هذه الديناميكيات يقدم لنا آفاقًا جديدة في مجال الذكاء الاصطناعي الإبداعي.
استكشاف التنوع: كيف تقيس الذكاء الاصطناعي الإبداع عبر مفاجآت شرطية متقدمة!
في عالم الذكاء الاصطناعي، يعتبر قياس تنوع الإبداعات أمرًا حيويًا لفهم أداء النماذج بعد التدريب. منهجية جديدة أُطلقت لقياس هذا التنوع باستخدام التعلم ضمن السياق، مما يساعد على تقييم النماذج بشكل أفضل.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
