في عالَم الذكاء الاصطناعي، تُعتبر نماذج اللغات الضخمة (LLMs) أدوات ثورية تستخدم في محاكاة الهيئات الاجتماعية، لكن يبقى التساؤل حول ما إذا كانت سلوكياتها يمكن اعتبارها تعبيراً دقيقاً عن اتخاذ القرارات البشرية. في هذا السياق، أجرت دراسة جديدة تجربة مثيرة من خلال تطبيق تجربة "معضلة السجين" على نطاق واسع، حيث تم مقارنة أداء تسعة نماذج LLM مفتوحة الوزن مع بيانات من مشاركين من البشر.
تسلط هذه التجربة الضوء على بعض النتائج اللافتة، حيث استطاعت النماذج المختارة أن تعكس بعض السمات الكلية لديناميكيات التعاون، مثل التراجع المبكر ثم استقرار التعاون لاحقاً. ومع ذلك، فإن هذا التوافق الإجمالي لم يمتد إلى مستويات أعمق من السلوك الفردي، حيث أظهرت LLMs أنها تقلل من تباين السلوك الفردي وتنتج أنماط تعاون مشروطة تختلف عن تلك الملاحظة لدى البشر.
كما أظهرت الدراسة أنه بإضافة جزء من الوكلاء العشوائيين، يمكن تحسين بعض جوانب التوافق على المستوى الجزئي، إلا أن هذا لم يزيل التباين في قواعد اتخاذ القرار. تكشف هذه النتائج عن انفصال بين السلوكيات الجماعية والفردية في الوكلاء المرتكزين على LLM: حيث يمكن أن تبدو النتائج الجماعية شبيهة بالبشر حتى عندما تكون التوزيعات السلوكية والآليات الأساسية غير متطابقة.
تشير هذه الاكتشافات إلى ضرورة مقارنة نماذج LLM بوساطة البشر عبر ديناميكيات مجمعة، وتباين فردي، وقواعد قرار تعتمد على السياق، بدلاً من الاعتماد فقط على توافق النتائج.
هل تعتقد أن نماذج الذكاء الاصطناعي يمكن أن تحاكي السلوك البشري بدقة؟ شاركونا آراءكم في التعليقات.
تعاون جماعي دون موثوقية فردية: دراسة جديدة تكشف حدود نماذج اللغات الضخمة (LLMs) في محاكاة السلوك البشري
دراسة جديدة تكشف عن فعالية نماذج اللغات الضخمة (LLMs) كعملاء في محاكاة الأنظمة الاجتماعية، لكن النتائج تُظهر وجود تفاوت بين السلوك الجماعي والفردي. هل تستطيع LLMs حقاً تقليد اتخاذ القرار البشري بشكل موثوق؟
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
