في عالم [الأبحاث](/tag/الأبحاث) العلمية، تتزايد أهمية [نماذج [اللغة](/tag/اللغة) الضخمة](/tag/[نماذج](/tag/نماذج)-[اللغة](/tag/اللغة)-الضخمة) ([LLMs](/tag/llms)) وقدرتها على [محاكاة](/tag/محاكاة) [التفاعلات](/tag/التفاعلات) الاجتماعية، حيث توفر لنا [أدوات جديدة](/tag/[أدوات](/tag/أدوات)-جديدة) لفهم الظواهر الاجتماعية مثل [التعاون](/tag/التعاون) والتمييز. ولكن، ماذا يحدث عندما تصبح هذه [المحاكاة](/tag/المحاكاة) غير موثوقة؟

[دراسة](/tag/دراسة) حديثة أظهرت أن الادعاءات العلمية المستخلصة من [المحاكاة](/tag/المحاكاة) الاجتماعية لنماذج [اللغة](/tag/اللغة) الضخمة يجب ألا تكون أقوى من [تدقيق](/tag/تدقيق) [الموثوقية](/tag/الموثوقية) ([Robustness](/tag/robustness) Audits) الذي يدعمها. وقد تبين أن هذه [المحاكاة](/tag/المحاكاة) يمكن أن تكون عرضة لتغييرات صغيرة تؤدي إلى نتائج ضخمة في المجتمعات، وهو ما يشير إليه مفهوم "أثر الفراشة".

تناولت [الدراسة](/tag/الدراسة) حالتين دراسيتين: لعبة معضلة المسجونين (Prisoner's Dilemma) ومحاكاة لفقاعات [وسائل [التواصل](/tag/التواصل) الاجتماعي](/tag/وسائل-[التواصل](/tag/التواصل)-الاجتماعي). وأظهرت النتائج أن [تغييرات](/tag/تغييرات) بسيطة في [تصميم](/tag/تصميم) الشخصيات أو [توجيهات](/tag/توجيهات) [اللعبة](/tag/اللعبة) يمكن أن تؤثر بشكل كبير على معدلات التعاون، حيث تصل التغيرات إلى 76 نقطة مئوية.

كما وجدت [الدراسة](/tag/الدراسة) أن الحساسية غير متساوية [عبر](/tag/عبر) الاختيارات [المعمارية](/tag/المعمارية) وعائلات النماذج، بعبارة أخرى، نفس التغيير قد يؤثر بشكل مختلف على [نماذج متعددة](/tag/[نماذج](/tag/نماذج)-متعددة).

للتغلب على هذه [الفجوة](/tag/الفجوة) في التحقق، تم تقديم نظام [تصنيف](/tag/تصنيف) للتدقيق في [الموثوقية](/tag/الموثوقية) يسمى TRAILS، الذي يغطي ثلاثة مستويات من [تصميم](/tag/تصميم) [المحاكاة](/tag/المحاكاة): مستوى الوكيل (micro-level) والتفاعل (meso-level) والنظام (macro-level).

واختتمت [الدراسة](/tag/الدراسة) بالدعوة إلى ضرورة أن تصبح [الموثوقية](/tag/الموثوقية) شرطًا أساسيًا للتحقق قبل استخدام [محاكاة](/tag/محاكاة) [نماذج [اللغة](/tag/اللغة) الضخمة](/tag/[نماذج](/tag/نماذج)-[اللغة](/tag/اللغة)-الضخمة) لتفسير الآليات الاجتماعية أو [تقييم](/tag/تقييم) التدخلات.