في عالم التجارة الحديث، أصبحت مفاوضات الأسعار الشخصية (Personalized Pricing Negotiations) من التحديات المثيرة للاهتمام لوكلاء نماذج اللغات الضخمة (LLMs). فبغض النظر عن قدرة هؤلاء الوكلاء على إتمام الصفقات، فإن ذلك لا يضمن بالضرورة تحقيق أرباح جيدة. لهذا، تم تقديم نظام تقييم مبتكر يسمى **PrefBench**، والذي يعمل كنموذج محاكاة لاستكشاف ديناميكيات المفاوضات التي تعتمد على تفضيلات غير مكشوفة للمشتري.
يعمل **PrefBench** من خلال محاكاة لكل عملية مفاوضات، حيث يترافق مشترٍ افتراضي مع حزمة تخصيص مركبة ثابتة. يراقب البائع المعلومات العامة حول شخصية المشتري، والتفاصيل المتعلقة بالحزمة، وتاريخ المفاوضات، بينما تكون بعض المتغيرات الخفية المتعلقة بالمشتري، مثل مستوى الاستعداد للدفع وسلوكيات المساومة، مؤثرة في اتخاذ القرارات.
تم تقييم أداء وكلاء LLMs بتطبيق بروتوكول ملخص الحالة الذي يقيد الوكلاء للعودة إلى إجراءات JSON صارمة تحت حدود المعلومات المخفية. وقد تمت الاختبارات على أكثر من 7500 حلقة، وأظهرت النتائج أن متوسط الأرباح للبائعين من LLMs لا يتجاوز الحد الأدنى، مما يشير إلى أن تحقيق النجاح في الصفقات لا يعني بالضرورة تحسين الأرباح.
هذه النتائج المثيرة تسلط الضوء على التحديات التي قد تواجهها نماذج الذكاء الاصطناعي عند محاولتها التكيف مع وفق تفضيلات المشترين المخفية، مما يمهد الطريق لمستقبل يتطلب تطوير استراتيجيات أكثر فعالية في المفاوضات.
PrefBench: ثورة في تقييم وكلاء الذكاء الاصطناعي في مفاوضات الأسعار الشخصية المخفية!
تقدم دراسة جديدة عن PrefBench معيارًا مبتكرًا لاختبار أداء وكلاء نماذج اللغات الضخمة (LLMs) في مفاوضات الأسعار الشخصية المخفية. على الرغم من نجاح الوكلاء في إتمام الصفقات، فإن النتائج المالية لهم لا تزال ضعيفة، مما يثير تساؤلات حول فعالية استراتيجياتهم.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
