في عالم الذكاء الاصطناعي، تُعتبر نماذج اللغات الضخمة (LLMs) من أبرز الابتكارات التي غيرت كيفية تفاعلنا مع الآلات. إلا أن هذه النماذج شهدت مشكلة كبيرة تُعرف بـ "فقدان في المحادثة" (Lost in Conversation)، حيث تنخفض أدائها بشكل يثير القلق عندما يتم استكشاف مهمة معينة على مراحل متعددة. تشير الدراسات إلى أن هذه النماذج قد تفقد حتى 39% من أدائها في مثل هذه السيناريوهات.

الأساس وراء هذا الفشل يعود إلى هيكلية المحادثة، التي تعطي وزنًا متساويًا لكل جزء من الحوار، مما يجعل من الصعب على النموذج التفريق بين العوامل الحرجة والمعلومات العرضية. هنا تأتي تقنية SeDT (Sentence-Transformer Decision-Transformer) لتحدث ثورة في تحديد أداء هذه النماذج.

تعتمد SeDT على طريقة مبتكرة تعتمد على استيراد معلومات التوجه لعودته إلى القاعدة من التعلم المعزز (offline reinforcement learning) دون الحاجة إلى تدريب إضافي. بإمكان هذه التقنية تصنيف كل جزء من المحادثة وفقًا لإشارة تراكمية تستند إلى ثلاث هياكل: السيمانتية، واللغة، والموقع. ومن ثم، يتم تقديم السجل المحاور الموثق بالكامل للنموذج في النقطة الأخيرة للحوار.

تمت تجربة SeDT على معيار "فقدان في المحادثة" في ثلاثة نماذج LLMs وثلاث مهام مختلفة للتوليد، حيث أثبتت تفوقها على الممارسات التقليدية في جميع التوليفات، مع زيادة قدرها 37.7% في الأداء في بعض الحالات، مما يقلل من مشكلة عدم الموثوقية إلى حد كبير.

باختصار، يُظهر استخدام تقنية SeDT أن إخبار النموذج بالتوجهات الحرجة في المحادثة يمكن أن يعيد له الأداء المفقود بشكل كبير. هل تتخيل كيف يمكن أن يؤثر ذلك على تفاعلاتنا اليومية مع الذكاء الاصطناعي؟ ما رأيكم في هذا التطور؟ شاركونا في التعليقات!