في عالم الذكاء الاصطناعي، تسعى الأبحاث دوماً لتطوير أدوات حديثة تسهم في التعامل الفعال مع المواقف الحرجة. ومن أبرز الابتكارات التي تم الكشف عنها مؤخراً هي تقنية “اختيار سياسة الحوار” (Dialogue Policy Selection) أو ما يعرف اختصاراً بـ DiPS. تستند هذه التقنية إلى نماذج اللغات الكبيرة (Large Language Models) مثل GPT، والتي تعاني غالبًا من صعوبة في توظيف استراتيجيات إقناع فعالة في المواقف الحرجة.

التحدي يكمن في أنّ كل شخص له شخصيته الخاصة واهتماماته التي تتطلب استراتيجيات مخصصة للإقناع، بدلاً من نهج موحد للجميع. لتجاوز هذه العقبة، تم تسليط الضوء على سيناريو إنقاذ من حريق يتطلب من المشغل إقناع سكان المبنى بإخلائه.

تستخدم DiPS إطار عمل التعلم العميق Q-learning لاختيار استراتيجيات الإقناع بشكل ديناميكي، ومحاكاة سياق المحادثة بصورة تتناسب مع ردود فعل الناس في اللحظة. ومن خلال تدريب ناقد يعمل على زيادة احتمالية نجاح الإخلاء بناءً على تعليقات السكان، تتيح هذه التقنية للمشغل اختيار السياسة المثلى للإقناع في كل لحظة.

ولإثبات فعالية DiPS، أجريت تقييمات مقارنة مع تقنيات أخرى، بما في ذلك نماذج لغوية تقليدية ونهج معزز بالبحث المستند إلى النصوص (RAG). وكانت النتيجة مثيرة؛ إذ أظهرت DiPS نجاحًا أكبر في تحقيق الإخلاء مقارنةً بالنموذج التقليدي، مما يدل على قدراتها الكبيرة في مجالات الإقناع والتفاعل الإنساني.

مع تقدم هذه التقنية، يبدو أن مستقبل الإقناع في مواقف الطوارئ يمكن أن يصبح أكثر أمانًا وفعالية. فما رأيكم في هذا التطور المثير؟ شاركونا في التعليقات.