في العصر الحديث، أصبحت [نماذج [اللغة](/tag/اللغة) الضخمة](/tag/[نماذج](/tag/نماذج)-[اللغة](/tag/اللغة)-الضخمة) (Large Language [Models](/tag/models)) تلعب دوراً مهماً في [محاكاة](/tag/محاكاة) استجابات الاستبيانات، ولكن هل يمكن الاعتماد عليها تماماً؟ إن استخدام [البيانات الاصطناعية](/tag/[البيانات](/tag/البيانات)-الاصطناعية) قد لا يتماشى مع الواقع، مما يسبب [استنتاجات](/tag/استنتاجات) غير دقيقة. لذا، تم [تطوير](/tag/تطوير) إطار [عمل](/tag/عمل) شامل يُحول الاستجابات المحاكية من [نماذج اللغة](/tag/[نماذج](/tag/نماذج)-[اللغة](/tag/اللغة)) إلى مجموعات [ثقة](/tag/ثقة) موثوقة.

واحدة من النقاط الرئيسية في هذا [البحث](/tag/البحث) هي طريقة تقدير [عدم اليقين](/tag/عدم-اليقين) الناشئ عن عدم [توافق](/tag/توافق) البشر مع [نماذج [اللغة](/tag/اللغة) الضخمة](/tag/[نماذج](/tag/نماذج)-[اللغة](/tag/اللغة)-الضخمة). وقد تم تحديد [عدد](/tag/عدد) الاستجابات المحاكية كاختيار [تصميم](/tag/تصميم) رئيسي؛ حيث إن العدد الزائد من الاستجابات يعطي مجموعات ضيقة جداً مع تغطية ضعيفة، في حين أن العدد القليل يؤدي إلى مجموعات واسعة تتأثر بالضوضاء العشوائية.

يتضمن الحل المُقترح نهجاً مدفوعاً بالبيانات يعمل على اختيار حجم العينة لمحاكاة الاستجابات بشكل يتماشى مع تغطية متوسطة موثوقة، بغض النظر عن [دقة](/tag/دقة) [المحاكاة](/tag/المحاكاة) أو طريقة [بناء](/tag/بناء) مجموعة [الثقة](/tag/الثقة). وبالإضافة إلى ذلك، يبين حجم العينة المختار حجم السكان البشري الفعّال الذي يمكن أن تمثله [نموذج](/tag/نموذج) اللغة، مما يوفر مقياساً كميًّا لدقة [المحاكاة](/tag/المحاكاة).

أظهرت [التجارب](/tag/التجارب) التي أُجريت على [مجموعات بيانات](/tag/مجموعات-[بيانات](/tag/بيانات)) [استبيانات](/tag/استبيانات) حقيقية تنوعاً في معدل [دقة](/tag/دقة) [محاكاة](/tag/محاكاة) الاستجابات من قبل [نماذج [اللغة](/tag/اللغة) الضخمة](/tag/[نماذج](/tag/نماذج)-[اللغة](/tag/اللغة)-الضخمة) في مجالات مختلفة، مما يفتح المجال لمزيد من [البحث والتطوير](/tag/[البحث](/tag/البحث)-والتطوير) في هذا المجال الحيوي.