مع النجاح المتزايد للنماذج التوليدية (Generative Models) في مجالات الصور والنصوص، أصبح سؤال التقييم محط اهتمام كبير في الأوساط الأكاديمية والصناعية. غالبًا ما تعتمد الأساليب الحديثة على مقاييس عددية بسيطة، لكن إدخال مفهوم دقة واسترجاع (Precision and Recall) للنماذج التوليدية يفتح آفاقًا جديدة للبحث.

تُمكن منحنيات الدقة والاسترجاع الباحثين من إجراء تحليل أكثر ثراءً، رغم أن تقدير هذه المنحنيات يواجه تحديات متعددة. في هذا السياق، نقدم إطارًا جديدًا لتقدير منحنيات الدقة والاسترجاع بالكامل استنادًا إلى منظور التصنيف الثنائي. تركز هذه الدراسة على تحليل إحصائي شامل للتقديرات المقترحة، مما ينجم عنه حدود عُليا للحد الأدنى على مخاطر تقدير دقة واسترجاع.

علاوة على ذلك، يظهر إطارنا امتدادات عدة لمقاييس الدقة والاسترجاع التقليدية الموجودة في الأدبيات والتي كانت مقيدة بقيم منحنيات معينة. وأخيرًا، ندرس السلوكيات المختلفة للمنحنيات الناتجة عن التجارب التي أُجريت في إعدادات متنوعة.

هل أنتم متحمسون لرؤية كيف ستؤثر هذه التطورات على مستقبل النماذج التوليدية؟ شاركونا آرائكم!