تعتبر قدرة النماذج اللغوية الكبيرة (Large Language Models) على تجاوز البشر في مجالات الرياضيات والترميز أمراً مثيراً للإعجاب، ولكنها لا تزال تعاني من تحديات كبيرة في التفكير السببي. تكمن المشكلة الأساسية في البيانات نفسها، حيث أن الأنظمة السببية معقدة وغالباً ما تُعبر عن المعلومات بصيغ غير قابلة للتنفيذ، مما يجعل الحصول على إجابات دقيقة لاستفسارات السببية أمراً نادراً.

هنا يأتي دور CauSim، الإطار الجديد الذي يقدم حلاً مبتكراً لهذه التحديات عبر تحويل التفكير السببي من مشكلة تعاني من نقص في البيانات إلى مشكلة إشرافية قابلة للتوسع.

تقوم CauSim ببناء محاكيات سببية معقدة وقابلة للتنفيذ (Executable Structural Causal Models - SCMs) تدريجياً بواسطة النماذج اللغوية الكبيرة، مما يساعد على توسيع نطاق التطبيقات لتشمل أنظمة معقدة عالمياً مع الحفاظ على إجابات يمكن التحقق منها على استفسارات السببية.

علاوة على ذلك، يقوم CauSim بتحويل المعرفة السببية غير القابلة للتنفيذ إلى كود، مما يمكّن من زيادة البيانات وترجمة محاكيات SCMs القابلة للتنفيذ إلى لغة طبيعية، مما يسهل عمليات الإشراف على القياسات التي كان من الصعب الإشراف عليها في السابق.

تم تقسيم هذا البحث إلى قسمين رئيسيين: الأول يتناول كيفية بناء محاكيات سببية معقدة بشكل متزايد، والثاني هو دراسة نظامية لما يستطيع CauSim تحقيقه. يظهر البحث أن الإطار يمكن أن يسهم في التعميم عبر التمثيلات المختلفة، ويوفر فوائد مستمرة من حيث حجم المنهج وكمية البيانات، بالإضافة إلى تحسين الذات للنماذج اللغوية الكبيرة من خلال المحاكيات الذاتية التوليد.