تتطور تكنولوجيا الذكاء الاصطناعي بشكل مذهل، وأحدث إضافة إلى هذه التطورات هي أداة OmniToM الجديدة التي تهدف إلى قياس نظرية العقل (Theory of Mind) في نماذج اللغات الضخمة (LLMs). تمثل نظرية العقل القدرة على استنتاج المعرفة والنوايا والمشاعر لدى الآخرين، وهو أمر بالغ الأهمية لفهم ديناميكيات التفاعل الاجتماعي.
عادة ما يتم تقييم هذه القدرة في النماذج من خلال أسلوب يعتمد على الإجابة عن الأسئلة النهائية، مما يجعل من الصعب تحديد ما إذا كانت النماذج تفسر وتمثل الحالات الذهنية المطلوبة لتقديم استدلال قوي. في هذا السياق، تأتي أداة OmniToM لتقدم حلاً مبتكراً حيث تتطلب من النماذج نمذجة هياكل الاعتقاد لكل شخصية في السرد.
تتكون هذه الهياكل من مقترحات اعتقادية، وهي عبارات بسيطة توضح ما يعتقده كل شخصية عن العالم أو عن الحالة الذهنية لشخصية أخرى. يمكن من خلال هذه المقترحات تحليل المعرفة والنوايا والمشاعر والاعتقادات الخاطئة بطريقة موحدة.
تجري عملية تقييم النماذج على مرحلتين:
- **المرحلة الأولى: استخلاص الاعتقاد (Belief Extraction)**: حيث يتم استخراج الاعتقادات ذات الصلة من السرد.
- **المرحلة الثانية: تصنيف الاعتقاد (Belief Labeling)**: حيث يتم تصنيف كل اعتقاد وفقاً لسبع معايير تشمل ترتيب الاستدلال وحالة الحقيقة وموارد المعرفة.
تم بناء الأداة على مجموعة قصص تتكون من 895 قصة من مجموعة ToMBench و21,343 مقترح اعتقادي مصنف. يستخدم OmniToM نظام توضيح مساعدة يعتمد على نماذج اللغة البشرية للتأكد من دقة النتائج.
على الرغم من تنوع النماذج المستخدمة في التقييم، تكشف OmniToM عن عقبات في تتبع اعتقادات الشخصيات، حيث تكافح النماذج الحالية في الوصول إلى المعرفة واتخاذ القرارات التمثيلية. هذا التحدي يعني أن النماذج بحاجة إلى تحسين كبير لفهم الحقائق السردية وتحويلها إلى اعتقادات مشتركة بين الشخصيات.
التقدم في هذا المجال قد يفتح أبواباً جديدة لفهم كيفية تفاعل نماذج الذكاء الاصطناعي مع الأفكار البشرية المعقدة.
اكتشاف أعماق الذكاء الاصطناعي: أداة OmniToM لقياس نظرية العقل في نماذج اللغات الضخمة!
تقدم أداة OmniToM تقويماً جديداً لنظرية العقل في نماذج اللغات الضخمة، حيث تقيّم كيفية فهم هذه النماذج للمعرفة والمشاعر. هذا الابتكار يسلط الضوء على تحديات مذهلة في فهم النماذج للعقول البشرية المعقدة.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
