في عالم الذكاء الاصطناعي، تُظهر نماذج اللغة الكبيرة (Large Language Models) قدرة مذهلة على التعلم من أمثلة قليلة (few-shot learning) عند توفير العروض المناسبة. ولكن، هل تعلم أن هذه الميزة يمكن أن تتحول إلى عائق في سيناريوهات الوكالة متعددة الأدوار؟ تم تحديد ظاهرة تُعرف باسم الجمود المحادثاتي (conversational inertia)، حيث تميل النماذج إلى تقليد ردودها السابقة بشكل غير صحيح، مما يقلل من استكشاف الخيارات الجديدة.
أظهرت الدراسات من خلال تحليل الانتباه أن النماذج تُظهر انتباهًا قويًا استنادًا إلى ردودها السابقة، وهو ما يرتبط بتحيز التقليد. هذا التحيز يحد من إمكانية الاستكشاف، مما يظهر تعارضًا عندما نرغب في تحويل النماذج الليميا (LLMs) إلى وكلاء ذكيين. فعلى الرغم من أن السياق الأطول يُغني من التغذية الراجعة البيئية، إلا أنه يعزز أيضًا الجمود المحادثاتي الذي يُضعف عملية الاستكشاف.
الملاحظة الرئيسية هنا هي أن الأفعال الناتجة عن سياقات أطول تُظهر جمودًا أكبر مقارنة بتلك الناتجة عن سياقات أقصر. من هنا، يُمكننا بناء أزواج تفضيل دون المكافآت البيئية. استنادًا إلى هذه الرؤية، تم اقتراح تعلم تفضيل السياق (Context Preference Learning) لضبط تفضيلات النموذج لصالح الردود ذات الجمود المنخفض.
بالإضافة إلى ذلك، تم تقديم استراتيجيات إدارة السياق خلال زمن الاستدلال لتحقيق توازن بين الاستكشاف واستغلال المعلومات. وقد أظهرت النتائج التجريبية عبر ثمانية بيئات وكيلة وسيناريو بحثي عميق أن هذا الإطار يقلل من الجمود المحادثاتي ويحقق تحسينات في الأداء.
هل تعاني نماذج الذكاء الاصطناعي من الجمود المحادثاتي؟ إليك الحل!
تعاني نماذج اللغة الكبيرة (LLMs) من مشكلة الجمود المحادثاتي في السيناريوهات متعددة الأدوار. اكتشف استراتيجيات جديدة لتعزيز التحليل والتحكم في التوجيهات لتحسين استجابة النماذج ورفع أدائها.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
