تتجه الممارسات العلمية المبتكرة نحو فهم كيفية تفاعل الإنسان مع نماذج الذكاء الاصطناعي (AI). في دراسة جديدة، تم تقديم مفهوم TUX، وهو مقياس يهدف إلى قياس الفهم الضمني (Tacit Understanding) بين البشر ونماذج اللغة الكبيرة (Large Language Models) في بيئات التعاون.
يتم تقييم توافق الإنسان مع الذكاء الاصطناعي غالباً من خلال معايير مثل نجاح المهمة، الدقة، أو تحسين المكافآت. ولكن، في العديد من السياقات التعاونية، يعتمد النجاح على الفهم الضمني، والذي يتضمن قدرة النموذج على التوافق مع المواقف التقييمية أو الاعتقادات التمثيلية لدى الإنسان دون وجود أهداف أو تواصل واضح.
لتسليط الضوء على هذه القدرات، طور الباحثون مهمة جديدة مُلهمة من اللعبة الاجتماعية "Wavelength"، حيث يُطلب من المشاركين البشر والنماذج عمومياً وضع مفاهيم على طيف شخصي. تم تعريف مؤشر الفهم الضمني (TUX) كمقياس ثنائي للمشابهة بين أحكام البشر والنماذج، وتم تقييمه مع 241 مشاركًا بشريًا و200 نموذج من نماذج الذكاء الاصطناعي المعتمدة على ملف شخصي عبر أربعة نماذج مختلفة.
تشير النتائج إلى أن الأزواج البشرية-الذكاء الاصطناعي الأقرب في الفضاء السماتي يحققون TUX أعلى بشكل ملحوظ، مما يدل على أن الفهم الضمني يتشكل بناءً على الخصائص الفردية بدلاً من كونه تشابه عشوائي. كما أظهرت تحليلات الانحدار أن TUX يصبح أكثر قابلية للتفسير مع تزايد مجموعة المتنبئين، حيث تُحسن الصفات الفردية وأنماط اتخاذ القرار والثقة من الأداء مقارنةً بأسس المسافة السماتية العامة.
تشير هذه الاكتشافات إلى أن الفهم الضمني بين البشر ونماذج اللغة الكبيرة قابل للقياس، مما يكشف عن حدود الاعتماد على التكيفية المستندة إلى الملفات الشخصية لفهم توافق التمثيلات الأعمق.
قياس الفهم الضمني بين الإنسان والذكاء الاصطناعي: كيف تتوافق نماذج الذكاء الاصطناعي مع تقييماتنا؟
تقدم الأبحاث الجديدة مفهوم TUX لقياس الفهم الضمني بين الإنسان ونماذج الذكاء الاصطناعي، مما يكشف كيف يمكن أن تتماشى هذه النماذج مع تقييماتنا دون توجيهات واضحة. النتائج تظهر أهمية السمات الفردية في تحسين هذا الفهم.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
