في عصر تتزايد فيه الحاجة إلى الذكاء الاصطناعي في مختلف مجالات الحياة، أصبح من الضروري تزويد الوكلاء اللغويين (Language Agents) بقدرة قوية على التفاعل الاجتماعي. المشكلة الأساسية التي تواجه هؤلاء الوكلاء هي كيفية تعيين المكافآت بشكل صحيح، مما يُعرف بمشكلة نسبة الفضل (Credit Assignment Problem). في السابق، كانت الأساليب المتبعة في هذا الصدد تعتمد على نماذج اللغة لتوزيع المكافآت على مستوى الحلقة، مما يخلق نتائج تعتمد على الماضي وغير مستندة إلى أسس نظرية متينة.
ولكن الآن، جاء الابتكار مع نظام SAVOIR (ShApley Value fOr SocIal RL) الذي يمثل إطارًا جديدًا يتجاوز هذه التحديات. يستند هذا النظام إلى نظرية الألعاب التعاونية (Cooperative Game Theory) ويمزج بين مبدأين تكميليين: الأول هو تنقل المنفعة المتوقعة (Expected Utility) الذي ينقل التقييم من نسبة الفضل الراجعة إلى القيمة المستقبلية، مما يسمح بفهم الإمكانيات الاستراتيجية للجمل في تشكيل مسارات إيجابية مستقبلية. أما الثاني، فهو قيم شابلية (Shapley Values) التي تضمن توزيعًا عادلًا للفضل مع ضمانات نظرية عن الكفاءة، والتناظر، والحدية.
أظهرت التجارب على معيار SOTOPIA أن SAVOIR حقق أداءً غير مسبوق في جميع إعدادات التقييم، حيث تخطت نماذجنا، التي يتميز أحدها بـ 7 مليارات باراميتر، منافسين معروفين مثل GPT-4o وClaude-3.5-Sonnet. وهذه النتائج تؤكد أن الذكاء الاجتماعي يتطلب قدرات نوعية مختلفة تمامًا عن التفكير التحليلي التقليدي.
إذا كنت مهتماً بمستقبل الذكاء الاصطناعي والتفاعل الاجتماعي، فإن SAVOIR قد يكون خطوة رائدة نحو تحقيق ذلك.
سافور: الابتكار في الذكاء الاجتماعي عبر تقدير المكافآت المستندة إلى شابلية
تقدم SAVOIR نظامًا مبتكرًا لمساعدة الوكلاء اللغويين في فهم التعقيدات الاجتماعية. يعتمد هذا النظام على نظرية الألعاب التعاونية لتحسين أداء الحوارات متعددة الأدوار.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
