في عالم [الأبحاث](/tag/الأبحاث) العلمية، تتزايد أهمية [نماذج [اللغة](/tag/اللغة) الضخمة](/tag/[نماذج](/tag/نماذج)-[اللغة](/tag/اللغة)-الضخمة) ([LLMs](/tag/llms)) وقدرتها على [محاكاة](/tag/محاكاة) [التفاعلات](/tag/التفاعلات) الاجتماعية، حيث توفر لنا [أدوات جديدة](/tag/[أدوات](/tag/أدوات)-جديدة) لفهم الظواهر الاجتماعية مثل [التعاون](/tag/التعاون) والتمييز. ولكن، ماذا يحدث عندما تصبح هذه [المحاكاة](/tag/المحاكاة) غير موثوقة؟
[دراسة](/tag/دراسة) حديثة أظهرت أن الادعاءات العلمية المستخلصة من [المحاكاة](/tag/المحاكاة) الاجتماعية لنماذج [اللغة](/tag/اللغة) الضخمة يجب ألا تكون أقوى من [تدقيق](/tag/تدقيق) [الموثوقية](/tag/الموثوقية) ([Robustness](/tag/robustness) Audits) الذي يدعمها. وقد تبين أن هذه [المحاكاة](/tag/المحاكاة) يمكن أن تكون عرضة لتغييرات صغيرة تؤدي إلى نتائج ضخمة في المجتمعات، وهو ما يشير إليه مفهوم "أثر الفراشة".
تناولت [الدراسة](/tag/الدراسة) حالتين دراسيتين: لعبة معضلة المسجونين (Prisoner's Dilemma) ومحاكاة لفقاعات [وسائل [التواصل](/tag/التواصل) الاجتماعي](/tag/وسائل-[التواصل](/tag/التواصل)-الاجتماعي). وأظهرت النتائج أن [تغييرات](/tag/تغييرات) بسيطة في [تصميم](/tag/تصميم) الشخصيات أو [توجيهات](/tag/توجيهات) [اللعبة](/tag/اللعبة) يمكن أن تؤثر بشكل كبير على معدلات التعاون، حيث تصل التغيرات إلى 76 نقطة مئوية.
كما وجدت [الدراسة](/tag/الدراسة) أن الحساسية غير متساوية [عبر](/tag/عبر) الاختيارات [المعمارية](/tag/المعمارية) وعائلات النماذج، بعبارة أخرى، نفس التغيير قد يؤثر بشكل مختلف على [نماذج متعددة](/tag/[نماذج](/tag/نماذج)-متعددة).
للتغلب على هذه [الفجوة](/tag/الفجوة) في التحقق، تم تقديم نظام [تصنيف](/tag/تصنيف) للتدقيق في [الموثوقية](/tag/الموثوقية) يسمى TRAILS، الذي يغطي ثلاثة مستويات من [تصميم](/tag/تصميم) [المحاكاة](/tag/المحاكاة): مستوى الوكيل (micro-level) والتفاعل (meso-level) والنظام (macro-level).
واختتمت [الدراسة](/tag/الدراسة) بالدعوة إلى ضرورة أن تصبح [الموثوقية](/tag/الموثوقية) شرطًا أساسيًا للتحقق قبل استخدام [محاكاة](/tag/محاكاة) [نماذج [اللغة](/tag/اللغة) الضخمة](/tag/[نماذج](/tag/نماذج)-[اللغة](/tag/اللغة)-الضخمة) لتفسير الآليات الاجتماعية أو [تقييم](/tag/تقييم) التدخلات.
هل يمكن الاعتماد على ادعاءات علمية من محاكاة اجتماعية لنماذج لغوية ضخمة؟ إليك الإجابة!
أظهرت دراسة جديدة أن الادعاءات العلمية المستمدة من محاكاة نماذج اللغة الضخمة (LLMs) يجب أن تستند إلى تدقيق موثوق. هذا البحث يكشف عن تأثير تغيرات صغيرة في التصميم على النتائج الكبيرة في مجالات التعاون وتكوين المعايير الاجتماعية.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
