في عالم الذكاء الاصطناعي، تُعتبر نماذج اللغات الضخمة (LLMs) من أبرز الابتكارات التي غيرت كيفية تفاعلنا مع الآلات. إلا أن هذه النماذج شهدت مشكلة كبيرة تُعرف بـ "فقدان في المحادثة" (Lost in Conversation)، حيث تنخفض أدائها بشكل يثير القلق عندما يتم استكشاف مهمة معينة على مراحل متعددة. تشير الدراسات إلى أن هذه النماذج قد تفقد حتى 39% من أدائها في مثل هذه السيناريوهات.
الأساس وراء هذا الفشل يعود إلى هيكلية المحادثة، التي تعطي وزنًا متساويًا لكل جزء من الحوار، مما يجعل من الصعب على النموذج التفريق بين العوامل الحرجة والمعلومات العرضية. هنا تأتي تقنية SeDT (Sentence-Transformer Decision-Transformer) لتحدث ثورة في تحديد أداء هذه النماذج.
تعتمد SeDT على طريقة مبتكرة تعتمد على استيراد معلومات التوجه لعودته إلى القاعدة من التعلم المعزز (offline reinforcement learning) دون الحاجة إلى تدريب إضافي. بإمكان هذه التقنية تصنيف كل جزء من المحادثة وفقًا لإشارة تراكمية تستند إلى ثلاث هياكل: السيمانتية، واللغة، والموقع. ومن ثم، يتم تقديم السجل المحاور الموثق بالكامل للنموذج في النقطة الأخيرة للحوار.
تمت تجربة SeDT على معيار "فقدان في المحادثة" في ثلاثة نماذج LLMs وثلاث مهام مختلفة للتوليد، حيث أثبتت تفوقها على الممارسات التقليدية في جميع التوليفات، مع زيادة قدرها 37.7% في الأداء في بعض الحالات، مما يقلل من مشكلة عدم الموثوقية إلى حد كبير.
باختصار، يُظهر استخدام تقنية SeDT أن إخبار النموذج بالتوجهات الحرجة في المحادثة يمكن أن يعيد له الأداء المفقود بشكل كبير. هل تتخيل كيف يمكن أن يؤثر ذلك على تفاعلاتنا اليومية مع الذكاء الاصطناعي؟ ما رأيكم في هذا التطور؟ شاركونا في التعليقات!
تحسين موثوقية المحادثات: كيف يغير SeDT قواعد اللعبة في نماذج اللغات الضخمة!
في ظل التحديات التي تواجه نماذج اللغات الضخمة (LLMs) خلال المحادثات متعددة الأدوار، قدمت التقنية الجديدة SeDT حلاً مبتكرًا يعزز من الأداء. من خلال تصنيف الأجزاء الحوارية وفقًا لأهميتها، تمكنت من تقليل فقد الأداء بشكل ملحوظ.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
