تعتبر أنظمة التوصية جزءًا أساسيًا من الخدمات الإلكترونية الحديثة، حيث تساعد المستخدمين في تجاوز الكميات الضخمة من المحتوى المتنوع. لكن عملية تقييم هذه الأنظمة تظل تمثل تحديًا كبيرًا بسبب الفجوة بين المؤشرات المستخدمة في التقييمات غير المتصلة (offline) والأداء الفعلي (online).

ومع ظهور عملاء مدعومين بنماذج لغوية ضخمة (Large Language Models)، تبشر هذه التقنية الجديدة بحل واعد. إلا أن الدراسات الحالية غالبًا ما تُصوّر المستخدمين في عزلة، متجاهلة العوامل السياقية مثل الوقت، والموقع، والاحتياجات، التي تُشكل بشكل جوهري قرارات البشر.

في هذا الإطار، نقدم لكم 'ContextSim'، وهو نموذج يعتمد على الذكاء الاصطناعي يحاكي تفاعلات المستخدمين بشكل يجعله أقرب إلى الواقع. تتضمن هذه الطريقة وحدة محاكاة حياتية تُنشئ سيناريوهات تحدد متى وأين ولماذا يتفاعل المستخدمون مع التوصيات. ولضمان تماشي تفضيلات الوكلاء مع التصرفات البشرية الحقيقية، نقوم بنمذجة الأفكار الداخلية للوكلاء ونجعل اتخاذ القرارات متسقًا على كلا المستويين، الفعل والاتجاه.

أظهرت التجارب عبر دول متعددة أن الطريقة التي نقدمها تنتج تفاعلات تتماشى بشكل أكبر مع سلوكيات البشر مقارنةً بالأساليب السابقة. كما قمنا بالتحقق من صحة نهجنا من خلال ارتباط اختبار A/B غير المتصل، وأظهرنا أنه باستخدام معايير 'ContextSim' يتم تحسين المشاركة الفعلية في العالم الحقيقي.