في عالم التجارة الحديث، أصبحت مفاوضات الأسعار الشخصية (Personalized Pricing Negotiations) من التحديات المثيرة للاهتمام لوكلاء نماذج اللغات الضخمة (LLMs). فبغض النظر عن قدرة هؤلاء الوكلاء على إتمام الصفقات، فإن ذلك لا يضمن بالضرورة تحقيق أرباح جيدة. لهذا، تم تقديم نظام تقييم مبتكر يسمى **PrefBench**، والذي يعمل كنموذج محاكاة لاستكشاف ديناميكيات المفاوضات التي تعتمد على تفضيلات غير مكشوفة للمشتري.

يعمل **PrefBench** من خلال محاكاة لكل عملية مفاوضات، حيث يترافق مشترٍ افتراضي مع حزمة تخصيص مركبة ثابتة. يراقب البائع المعلومات العامة حول شخصية المشتري، والتفاصيل المتعلقة بالحزمة، وتاريخ المفاوضات، بينما تكون بعض المتغيرات الخفية المتعلقة بالمشتري، مثل مستوى الاستعداد للدفع وسلوكيات المساومة، مؤثرة في اتخاذ القرارات.

تم تقييم أداء وكلاء LLMs بتطبيق بروتوكول ملخص الحالة الذي يقيد الوكلاء للعودة إلى إجراءات JSON صارمة تحت حدود المعلومات المخفية. وقد تمت الاختبارات على أكثر من 7500 حلقة، وأظهرت النتائج أن متوسط الأرباح للبائعين من LLMs لا يتجاوز الحد الأدنى، مما يشير إلى أن تحقيق النجاح في الصفقات لا يعني بالضرورة تحسين الأرباح.

هذه النتائج المثيرة تسلط الضوء على التحديات التي قد تواجهها نماذج الذكاء الاصطناعي عند محاولتها التكيف مع وفق تفضيلات المشترين المخفية، مما يمهد الطريق لمستقبل يتطلب تطوير استراتيجيات أكثر فعالية في المفاوضات.