مع النجاح المتزايد للنماذج التوليدية (Generative [Models](/tag/models)) في مجالات [الصور](/tag/الصور) والنصوص، أصبح سؤال [التقييم](/tag/التقييم) محط اهتمام كبير في الأوساط الأكاديمية والصناعية. غالبًا ما تعتمد الأساليب الحديثة على [مقاييس](/tag/مقاييس) عددية بسيطة، لكن إدخال مفهوم [دقة](/tag/دقة) واسترجاع (Precision and Recall) للنماذج التوليدية يفتح آفاقًا جديدة للبحث.
تُمكن منحنيات [الدقة](/tag/الدقة) والاسترجاع [الباحثين](/tag/الباحثين) من إجراء [تحليل](/tag/تحليل) أكثر ثراءً، رغم أن تقدير هذه المنحنيات يواجه [تحديات](/tag/تحديات) متعددة. في هذا السياق، نقدم إطارًا جديدًا لتقدير منحنيات [الدقة](/tag/الدقة) والاسترجاع بالكامل استنادًا إلى منظور [التصنيف الثنائي](/tag/[التصنيف](/tag/التصنيف)-الثنائي). تركز هذه [الدراسة](/tag/الدراسة) على [تحليل إحصائي](/tag/[تحليل](/tag/تحليل)-إحصائي) شامل للتقديرات المقترحة، مما ينجم عنه حدود عُليا للحد الأدنى على [مخاطر](/tag/مخاطر) تقدير [دقة](/tag/دقة) واسترجاع.
علاوة على ذلك، يظهر إطارنا امتدادات عدة لمقاييس [الدقة](/tag/الدقة) والاسترجاع التقليدية الموجودة في الأدبيات والتي كانت مقيدة بقيم منحنيات معينة. وأخيرًا، ندرس السلوكيات المختلفة للمنحنيات الناتجة عن [التجارب](/tag/التجارب) التي أُجريت في إعدادات متنوعة.
هل أنتم متحمسون لرؤية كيف ستؤثر هذه التطورات على [مستقبل](/tag/مستقبل) [النماذج التوليدية](/tag/[النماذج](/tag/النماذج)-التوليدية)؟ شاركونا آرائكم!
ثورة جديدة في دقة النماذج التوليدية: إعادة نظر في قياس الدقة والاسترجاع
تعكس الأبحاث الجديدة تحولات مثيرة في كيفية تقييم النماذج التوليدية. الابتكارات في قياس الدقة والاسترجاع تقدم طرقًا جديدة لفهم فعالية هذه النماذج.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
