في عالم الذكاء الاصطناعي، لا تتوقف [الابتكارات](/tag/الابتكارات) عند حدود معينة. فعلى الرغم من [الأداء](/tag/الأداء) الجيد للنماذج اللغوية الكبيرة ([LLMs](/tag/llms)) في العديد من المهام اللغوية، إلا أن قدرتها على استيعاب مفهوم "[نظرية العقل](/tag/[نظرية](/tag/نظرية)-العقل)" (Theory of Mind - ToM) لا تزال بحاجة إلى [تحسين](/tag/تحسين) خاص في البيئات الاجتماعية المعقدة. ومن هنا، يأتي دور [البحث](/tag/البحث) الجديد الذي يحمل عنوان OSCToM.

تستعرض هذه الورقة البحثية طريقة OSCToM ([نظرية](/tag/نظرية) عقل الصدام الذاتي - Observer-Self Conflict Theory of Mind)، التي تسلط الضوء على كيفية [نمذجة](/tag/نمذجة) النزاعات المعقدة بين معتقدات المراقب ومعتقداته الشخصية. تتجاوز هذه الطريقة مجرد تبني وجهات نظر مختلفة، وتستدعي من [النماذج](/tag/النماذج) [التفكير](/tag/التفكير) المتكرر والمعقد.

تعتبر العلاقة بين المراقب ووجهات نظر الآخرين أمرًا بالغ الأهمية لفهم الديناميكيات الاجتماعية. من خلال الجمع بين [التعلم المعزز](/tag/[التعلم](/tag/التعلم)-المعزز) ([Reinforcement Learning](/tag/reinforcement-learning) - RL)، ولغة خاصة بالنطاق الموسع، والنماذج البديلة التراكيبية، [تحقق](/tag/تحقق) OSCToM تقدمًا ملحوظًا.

وفي [التجارب](/tag/التجارب) التي أُجريت، أثبت [نموذج](/tag/نموذج) OSCToM-8B أنه الأفضل في [تحقيق](/tag/تحقيق) النتائج بين الأنظمة التي تم اختبارها، حيث حقق 76% [دقة](/tag/دقة) في مجال [معلومات](/tag/معلومات) غير مواتية (FANToM)، مقارنةً بـ 0.2% فقط التي سجلها نظام ExploreToM.

كما أن [العملية](/tag/العملية) القابلة للتوليد للبيانات تعتبر أكثر [كفاءة](/tag/كفاءة) بستة أضعاف، مما يدل على أن [تدريب النموذج](/tag/[تدريب](/tag/تدريب)-النموذج) بشكل مستهدف يمكن أن يساعد [النماذج](/tag/النماذج) الأصغر في التعامل مع [التفكير المتقدم](/tag/[التفكير](/tag/التفكير)-المتقدم).

لمزيد من المعلومات، يمكنكم الاطلاع على [الكود](/tag/الكود) الخاص بالمشروع على [GitHub](/tag/github). إن هذه الخطوة تشكل بداية إمكانيات جديدة لنماذج الذكاء الاصطناعي، مما يُفتح المجال لفهم أعمق للعلاقات الاجتماعية واستجابات أكثر [دقة](/tag/دقة). ما رأيكم في هذا التطور؟ شاركونا في [التعليقات](/tag/التعليقات).