في عالم الذكاء الاصطناعي، الثقة في القدرات العقلية للآلات تتطلب أكثر من مجرد توقع الكلمات. دراسة جديدة تسلط الضوء على الفجوة بين نماذج اللغات الضخمة (Large Language Models) التي تعتمد على التنبؤ بالكلمات، والقدرة على التخطيط الذاتي القائم على الفكر الفيزيائي. هذه الدراسة التي نُشرت في arXiv تسلط الضوء على كيفية تقييم التخطيط التجسدي (Embodied Planning) من خلال عيون الباحثين.
تظهر النتائج أن النماذج الحالية تميل إلى تقليد الأنماط اللغوية بدلاً من متابعة العلاقات السببية، مما يحول التخطيط الفيزيائي إلى نماذج سطحية. لتجاوز هذه العقبة، قدم الباحثون مفهوم Causal-Plan-Bench، وهو مجموعة أدوات تشخيصية مصممة بعناية لتقييم التخطيط التجسدي عبر أربعة أبعاد سببية.
علاوة على ذلك، تم إنشاء Causal-Plan-1M، وهو مجموعة بيانات ضخمة تحتوي على مليون مقطع فيديو يتميز بتتبع التفكير الواضح، مما يفتح آفاقًا جديدة في فهم كيفية تفاعل النماذج مع العالم من حولها. نتائج التقييمات تشير إلى أن النماذج الرائدة، مثل Gemini 3 Pro، لا تزال تواجه صعوبات في إظهار الاستقلالية الحقيقية، حيث حققت فقط 38.18 نقطة في معايير التقييم المبتكرة.
ومع ذلك، فإن تدريبات Causal Planner المعتمدة على Qwen3-VL-8B تظهر تحسنًا ملحوظًا، مما يضع الأساس لنموذج يمكن أن يتبني المنطق الفيزيائي ليحقق تقديرات دقيقة حول الوضعيات المستقبلية. علاوة على ذلك، تبين أن توسيع بيانات التدريب السببي إلى مليون حالة يوفر تحسينًا نسبيًا بنسبة 36.3%.
إجمالًا، تقدم هذه الدراسة خطوة ملموسة نحو تحول الوكلاء من مجرد متنبئين سطحيين إلى مفكرين سببيين راسخين، مما يفتح الباب أمام إمكانيات جديدة ومثيرة في مجال الذكاء الاصطناعي.
هل يمكن للذكاء الاصطناعي أن يصبح عقيلاً؟ الانتقال من توقع الكلمات إلى التفكير الفيزيائي!
تقدم دراسة جديدة مفهومًا مبتكرًا يحول نموذج الذكاء الاصطناعي من مجرد توقع كلمات إلى التفكير الفيزيائي القائم على السببية، مما يعزز من قدرات التخطيط الذاتي. الدراسة تؤكد أهمية هذا التحول لتحقيق استقلالية فعلية للآلات.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
