في عالم الذكاء الاصطناعي، يعتبر اكتشاف العلاقات السبب-نتيجة حجر الزاوية للمنطق العلمي. ومع ذلك، لا يزال السؤال قائمًا حول ما إذا كانت نماذج اللغات الضخمة (LLMs) يمكنها القيام بذلك بموثوقية. أشارت الأبحاث الأخيرة إلى أن هذه النماذج، حتى بعد ضبطها بدقة، تواجه صعوبات في تحليل الرسوم البيانية السببية البسيطة، وتنكسر قدرتها مع زيادة التعقيد.
لكن لماذا تفشل هذه النماذج في ذلك؟ تشير الدراسات الجديدة إلى أن المشكلة ليست نتيجة خطأ في نموذج بعينه أو مجموعة بيانات، بل هي عيب أساسي في طريقة التعلم المستخدمة. تصف المسألة في شكل ما يسمى "نظرية القيود الأساسية"، وتظهر أن عمليات التكييف الفائق، والتحسين المباشر للتفضيلات، والتعلم في السياق ليست كافية لتمكين النماذج من تمييز الرسوم البيانية السببية التي تنتج بيانات ملاحظة مشابهة.
تقدم الدراسة نموذجًا مبتكرًا يُدعى "تحسين بايزي السببي الوكالي (A-CBO)", حيث يتم استخدام نموذج لغة مجمد كمرشد للتدخلات، للرد على استفسارات مستهدفة حول تأثيرات التدخل. يسمح هذا النموذج بتحسين قدرات الفهم السببي من خلال التركيز على المعتقدات حول الرسوم البيانية الممكنة بأعداد دورات لوغاريتمية، مما يؤدي إلى أداء تفوق النماذج الأخرى دون الحاجة إلى تدريب مستمر.
بالإضافة إلى ذلك، حقق نموذج A-CBO نتائج مبهرة في اختبارات مثل Corr2Cause، حيث كان أداءه على مستوى الاعتبارات المعاد ضبطها دون أي تدريب مسبق يسجل تقدمًا واضحًا. كما أنه تفوق بشكل ملحوظ في مجموعة الاختبار الجديدة Extended Corr2Cause، والتي تتناول 24 متغيرًا مع 18 ألف عينة اختبار، مما يجعل هذا البحث خطوة رائدة في مجال تعلم الآلة.
بذلك، لا توفر هذه الدراسة فحسب فهماً أعمق للتحديات التي تواجه نماذج اللغات الضخمة، بل أيضًا اقتراحات عملية للتغلب عليها، مما يدفعنا قدمًا نحو تحسين الأدوات المستخدمة في الذكاء الاصطناعي.
كيف تفشل نماذج اللغات الضخمة (LLMs) في اكتشاف الأسباب؟ وما الحلول الإبداعية لذلك!
درس حديث يكشف عن محدودية نماذج اللغات الضخمة (LLMs) في اكتشاف العلاقات السبب-نتيجة، ويقدم نموذجًا جديدًا بديلاً. تعرف على الآليات والمعوقات التي تؤثر على دقة هذه النماذج وكيف يمكن تجاوزها.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
