تشهد محركات البحث التي تعتمد على الذكاء الاصطناعي (AI) تحولات كبيرة في كيفية قياس الأداء والاستجابة. فلطالما اعتُبر القياس الكمي لرؤية الاقتباس في هذه الأنظمة أمرًا حاسمًا، لكن دراسة حديثة أثبتت أن هذا التقدير يجب أن يتفهم عدم اليقين الذي يكتنفه.
في إطار الإحصاءات المتقدمة، يُستحسن أن تُعتبر مؤشرات رؤية الاقتباس كمؤشرات عشوائية تعكس توزيع الاستجابة الفعلي، بدلاً من أن تكون قيمًا ثابتة. أجريت دراسة شاملة على ثلاثة منصات بحث توليدي، وهي Perplexity Search وOpenAI SearchGPT وGoogle Gemini، عبر مواضيع منتجات استهلاكية مختلفة.
استخدمت الدراسة نظامين لجمع العينة، أحدهما يعتمد على جمع البيانات يوميًا لمدة تسعة أيام، والآخر يقوم بجمع البيانات بتردد عالي كل عشر دقائق. النتائج أظهرت أن توزيعات الاقتباس تتبع نمط الانكسار وتُظهر تباينًا كبيرًا عند المقارنة بين العينات المختلفة.
كشفت الفحوصات الإحصائية، مثل فترات الثقة (Confidence Intervals)، أن العديد من الاختلافات الظاهرة بين النطاقات تقع ضمن مستوى الضوضاء لعملية القياس. كما أظهرت دراسة استقرار الرتب عبر التوزيعات أن التصنيفات ليست مستقرة، حتى بين المجالات الأعلى تصنيفًا.
تؤكد هذه النتائج أن مقاييس الرؤية التي تُحسب من جولة واحدة قد تعطي صورة مضللة حول أداء المجالات في البحث التوليدي. لهذا، من الضروري تضمين تقديرات عدم اليقين في تقارير رؤية الاقتباس، مع توفير إرشادات عملية حول أحجام العينات المطلوبة لتحقيق فترات ثقة مفهومة.
كيف تقيس عدم اليقين في رؤية الذكاء الاصطناعي؟ إطار إحصائي لرصد البحث التوليدي
تشير دراسة حديثة إلى أن مؤشرات رؤية الاقتباس في محركات البحث التوليدية ينبغي أن تُعتبر كعوامل عشوائية وليست ثوابت. من خلال تجارب على ثلاثة منصات، تم الكشف عن استقرار غير متوقع في تصنيفات الاقتباس.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
