تتوالى المفاجآت في عالم الذكاء الاصطناعي، وفي الآونة الأخيرة، أظهرت دراسة جديدة منشورة على موقع arXiv أن الاختلافات الطفيفة في صياغة استفسارات المشترين يمكن أن تؤدي إلى نتائج متباينة بشكل جذري في التوصيات التجارية من نماذج الذكاء الاصطناعي. تم تنفيذ هذا البحث على أكثر من 6000 عملية إعادة صياغة ونحو 6000 عملية تحكم بنفس الاستفسار عبر نماذج مثل OpenAI وAnthropic.
إذا كان المشترون يسألون عن "أفضل نظام إدارة علاقات العملاء (CRM)" بدلاً من "أعلى نظام إدارة علاقات العملاء" أو "أفضل نظام لإدارة العلاقات لشركات SaaS الناشئة"، فإن النتائج التي يحصلون عليها تختلف بشكل ملحوظ. حيث أن تحديد درجة التشابه بين مجموعات التوصيات تظهر نتيجة متدنية تصل إلى 0.288 عند استخدام تغييرات تجميلية في الصياغة و0.135 عند استخدام تغييرات تضيف قيودًا، مما يعني أن هذا يتناقض بشكل كبير مع المستوى المنشود الذي يتراوح بين 0.50 إلى 0.61.
هذا الأمر يسلط الضوء على أن المدخلات الضرورية للتوصيات ليست بالضرورة نابعة من نية المشتري، بل من كيفية صياغة السؤال نفسه. حتى عند زيادة الجهد في التفكير، فإن هذا الهوة لا تنغلق، مما يضع تساؤلات هامة حول فعالية استخدام أساليب تتبع مثل تقييم "رؤية العلامة التجارية (AI visibility)".
ومن المثير للاهتمام أن البحث يشير إلى أن تتبع ذكر العلامات التجارية بناءً على مجموعة ثابتة من الاستفسارات ينتج عنه قياسات تتأثر أكثر بعبارات إعادة الصياغة التي يستخدمها المتابعون بدلاً من سلوك النماذج نفسها.
علاوة على ذلك، يُظهر البحث أن استخدام عدة إعادة صياغات لكل نية شراء قد يقلل من هذه الظاهرة، ولكن مساحة عبارات المشترين الطبيعية تتجاوز بكثير ما تم التحقق منه في الأساليب الأكاديمية. ولذا، فإن قياس التأثيرات بشكل فوري عبر متابعة الاستفسارات أمر غير مستقر بشكل هيكلي، مما يستدعي البحث عن وحدات قياس جديدة تسهم في تحسين نتائج التوصيات.
سر هشاشة إعادة صياغة التوصيات التجارية المدعومة بالذكاء الاصطناعي: كيف تؤثر عبارات الشراء على النتائج؟
بحث جديد يكشف أن صغار الاختلافات في صياغة أسئلة المشترين تؤدي إلى توصيات متفاوتة تمامًا من مساعدي الذكاء الاصطناعي. تأثير غير متوقع لعوامل مثل الصياغة يثير تساؤلات حول كيفية قياس فعالية العلامات التجارية في المستقبل.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
