تمثل نماذج اللغات الضخمة (Large Language Models - LLMs) إحدى التقنيات الحديثة التي تم استخدامها بشكل متزايد في مجالات مختلفة، مثل تصنيف البيانات والتعليق عليها. ومع ذلك، فإن هذه النماذج تحمل مخاطر تعرض الأبحاث لممارسات غير أخلاقية مثل p-hacking، حيث يمكن للباحث تعديل المدخلات أو إعدادات النماذج حتى الحصول على النتائج المرغوبة.
لذا، اقترح الباحثون بروتوكولاً مبتكراً للحد من هذه المخاطر. يعتمد هذا البروتوكول على التسجيل المسبق للتجارب والنماذج المؤهلة، بحيث يقوم الباحث بتثبيت إجراءاته لدى النماذج الحالية، ويقوم بتسجيل خطة التحليل مع مجموعة من النماذج المستقبلية المؤهلة. بعد ذلك، تُجرى التحليلات التأكيديّة على أول نموذج مؤهل يتم إصداره بعد التسجيل المسبق.
نظرًا لأن هذا النموذج لا يوجد عند وقت الالتزام، فإنه لا يمكن أن يتعرض لممارسات p-hacking؛ إضافة إلى أن التكوينات التي تؤثر في نماذج أخرى غالبًا ما لا تُنتقل للنموذج الجديد. تم تقييم فعالية البروتوكول على مهمتين مختلفتين مع وجود قيم حقيقية معروفة، حيث أثبتت النتائج أن البروتوكول منع نقل ممارسات p-hacking في 73.9% و72.7% من الحالات على التوالي.
وقد أجريت تحليلات إضافية أظهرت أن كفاءة البروتوكول لا تزال كبيرة تحت مجموعة من الضغوط الاختبارية. وفي خطوة دالة على الالتزام، قام الباحثون بتطبيق البروتوكول على تجربتهم الخاصة، وأكدت النتائج الفعالية حيث فشل نقل 6 من 7 التكوينات التي عملت على النموذج السابق في النموذج الأول المؤهل الذي تم إصداره بعد ذلك.
بهذه الطريقة، تتعزز النزاهة البحثية في استخدام نماذج اللغات الضخمة، مما يجعل الأبحاث أكثر موثوقية ودقة.
كيف يمكن الحد من مخاطرات LLM باستخدام بروتوكول التسجيل المسبق؟
تعد نماذج اللغات الضخمة (LLMs) أداة قوية، لكن استخدامها في البحث قد يتيح فرصاً لممارسات غير أمينة مثل p-hacking. يقدم الباحثون بروتوكولاً جديداً لتقليل هذه المخاطر عبر التسجيل المسبق.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
