إدراك الفضاء هو حجر الزاوية في الذكاء المتعدد الوسائط، حيث يمكن النماذج من التفاعل بفعالية مع البيئة المادية المحيطة بها. ومع التقدم الكبير الذي شهدته نماذج اللغات الكبيرة متعددة الوسائط (Multimodal Large Language Models - MLLMs)، تبين أن المعايير الحالية في تقييم إدراك الفضاء غالبًا ما تقتصر على جوانب بسيطة، مما يهمش التعقيد الهيكلي للعلاقات المكانية.
في محاولة لسد هذه الفجوة، تم تطوير إطار إدراك الفضاء الهيكلي الذي يقسم قدرات الذكاء المكاني إلى خمسة مستويات متزايدة التعقيد، بدءًا من الملاحظات الأساسية وصولاً إلى التخطيط عالي المستوى. ومبنيًا على هذه التصنيفات، تم إنشاء سبايسال بينش، والذي يعد معيارًا كبيرًا يغطي 15 مهمة تم تصميمها لتتوافق مع هذه المستويات المعرفية.
لتحقيق تقييم موحد عبر المهام المتنوعة، تم إدخال مقياس جديد يركز على القدرات القابلة للتقييم، مما يتيح التحقق من قدرة النموذج على التفكير المكاني بشكل شامل.
أظهرت التجارب المكثفة التي أجريت على نماذج MLLMs الضخمة اختلافات واضحة في الأداء عبر المستويات المعرفية: حيث تتمتع النماذج بجذور إدراكية قوية لكنها تظل محدودة في فهم الرموز والتفكير السببي والتخطيط. كما أظهرت الاختبارات البشرية أن البشر يميلون إلى التجريد الانتقائي والموجه نحو الهدف، بينما تميل MLLMs إلى التركيز الزائد على التفاصيل السطحية دون وجود نية مكانية منسجمة.
يُعتبر عملنا الأول من نوعه، حيث يقدم إطارًا منهجيًا لقياس إدراك الفضاء في MLLMs، مؤسسًا بذلك قاعدة قوية لأنظمة ذكية مكانية مستقبلية.
سبايسال بينش: ثورة في تقييم نماذج الذكاء الاصطناعي متعددة الوسائط في إدراك الفضاء!
تشكل إدراكات الفضاء جزءًا أساسيًا من الذكاء المتعدد الوسائط، مما يساعد النماذج على التفاعل بكفاءة مع العالم المادي. يقدم إطار سبايسال بينش طريقة جديدة لتقييم هذه القدرات.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
