في عالم الذكاء الاصطناعي، يعتبر تمكين النماذج اللغوية الكبيرة (Large Language Models) بذاكرة طويلة الأمد خطوة رئيسية نحو بناء وكلاء ذكيين يمكنهم التكيف مع احتياجات المستخدمين المتغيرة. ولكن، كيف يمكن تقييم هذه القدرات بشكل فعال؟ هنا تأتي أهمية PERMA.

PERMA هو معيار تم تصميمه لتقييم الاستمرارية الشخصية للذكاء الاصطناعي مع مرور الوقت، متجاوزًا أساليب التقييم التقليدية التي تدمج محادثات متعلقة بالتفضيلات مع أخرى غير ذات صلة، مما يجعلها أشبه بالبحث عن إبرة في كومة قش. إذ تكشف هذه الطريقة عن حقيقة هامة؛ أن تفضيلات المستخدم تتطور تدريجيًا وتتكامل عبر العديد من التفاعلات في سياقات معقدة.

يقدم الفريق البحثي صيغة جديدة للتقييم تشمل (1) تنوع النصوص و(2) توافق لغوي لمحاكاة إدخالات المستخدم غير المنتظمة. تتكون اختبارات PERMA من أحداث تفاعلية مرتبة زمنياً، تشمل استفسارات تتعلق بالتفضيلات تم إدخالها على فترات زمنية مختلفة.

لمعرفة مستوى فهم النماذج لشخصية المستخدم على مدار الخط الزمني للتفاعل، صُممت مهام تفاعلية متعددة الخيارات. وقد أظهرت التجارب أن أنظمة الذاكرة المتقدمة يمكنها استخراج تفضيلات دقيقة وتقليل استهلاك الرموز، متفوقة على الطرق التقليدية لاسترجاع البيانات.

على الرغم من هذا النجاح، لا تزال النماذج تواجه تحديات في الحفاظ على شخصية متماسكة عبر عمق زمني وتداخل مجالات متعددة، مما يشير إلى الحاجة إلى إدارة ذاكرة شخصية أكثر فعالية. ولكن رؤية الأبحاث المفتوحة المصدر متاحة على [https://github.com/PolarisLiu1/PERMA]، مما يساهم في تطوير هذه الأنظمة لمستقبل أكثر تطورًا.

ماذا تعتقد عن التطورات الجديدة في ذكاء الاصطناعي؟ هل تعتبر أن التخزين الشخصي يعد خطوة أساسية في تحسين تجربة المستخدم؟ شاركونا آرائكم في التعليقات.