في عصر تتزايد فيه الاعتماد على الذكاء الاصطناعي (AI)، يبرز مفهوم الوكلاء المتجسدين الذين يتسمون بالذكاء والاستقلالية. ومع ذلك، فإن التحدي الكبير الذي يواجه هذه النماذج هو قدرتها على اتخاذ قرارات مستنيرة بعيدة عن ردود الفعل السلبية أو اتباع التعليمات فقط. هنا، تدخل تقنية "ValuePlanner" كحل مبتكر.

يقدم نظام "ValuePlanner" هيكلًا هرميًا يمكنه فصل تخطيط القيم العليا عن تنفيذ الإجراءات الأدنى. من خلال الاعتماد على نماذج اللغات الضخمة (Large Language Models)، يسمح النظام بتوليد أهداف رمزية عن طريق التفكير في تبادل القيم المعقدة، مما يمكّن الوكلاء من معالجة النزاعات التحفيزية بشكل أكثر فعالية.

بعد ذلك، تُترجم هذه الأهداف إلى خطط تنفيذ قابلة للتطبيق بواسطة مخطط PDDL التقليدي، ويتم تحسين هذا العمل من خلال آلية تغذية راجعة مغلقة. لا يعد نجاح المهمات كمعيار وحيد لتقييم هذه الأنظمة كافيًا، لذلك تم تقديم مجموعة تقييم تركز على القيمة تقيس الزيادة التراكمية في القيمة، وتوافق التفضيلات، وتنوع السلوكيات.

مجموعة من التجارب في بيئة "TongSim" المنزلية أثبتت فعالية "ValuePlanner" في التحكيم بين القيم المتنافسة لإنتاج سلوك ذاتي وذو أفق طويل، وهو أمر يغيب عن الوكلاء الذين يتبعون التعليمات واحتياجات تفاعل الأفراد. يمثل هذا العمل تقدمًا هيكليًا في سد الفجوة بين القيم الجوهرية والسلوكيات القائمة على الأرض للوكلاء المستقلين.

إذا كنت مهتمًا بمستقبل الذكاء الاصطناعي وتطبيقاته في حياتنا اليومية، فما رأيك في هذا التطور المثير؟ شاركنا آرائك في التعليقات!