تتطلب مهارات التفكير الجغرافي (Geospatial Reasoning) القدرة على حل المشكلات المرتبطة بالصور المعززة من خلال الفهم المعقد للهياكل المكانية للبيئة. ومع ذلك، فإن تطوير هذه القدرة غالباً ما يواجه عقبات، أبرزها تكاليف تعيين حيز واسع ومعقد من الأسئلة.

هنا تأتي تقنية GeoX، التي تقدم إطار عمل ذكي يعتمد على اللعب الذاتي (Self-Play)، حيث يتمكن النظام من تطوير منطق الفضاء من خلال برامج قابلة للتنفيذ تمنح مكافآت يمكن التحقق منها دون الاعتماد على بيانات مكثفة تم تنظيمها بواسطة البشر.

عند تزويد النظام بصورة فضائية أو جوية، يقوم إطار العمل الخاص بنا بتوظيف سياسة متعددة الوسائط (Multimodal Policy) تقترح مشكلات مكانية على شكل برامج قابلة للتنفيذ، ويقوم بحلها تحت ثلاثة أوضاع من التفكير: الاستدلال (Abduction) والاستنتاج (Deduction) والاستقراء (Induction) باستخدام أدوات لفهم الصور.

تقوم وحدة التحقق (Verifier) بتنفيذ كل برنامج لتحويل إشارة المكافأة التي تعزز الأداء المشترك على أساس التعلم التعزيزي (Reinforcement Learning). أظهرت تقنية GeoX تحسينات ملحوظة تصل إلى 5.5 نقطة في المتوسط في نماذج اللغة الضخمة (VLMs) الأساسية، مما يجعلها تنافس أو تتجاوز الأسس التقليدية التي تم تدريبها على ملايين البيانات المنظمة.

بالإضافة إلى الأسلوب المبتكر، نطلق مجموعة بيانات معيارية لفهم الجغرافيا تم تجميعها من خلال اللعب الذاتي، مما يمثل خطوة هامة نحو تحسين الذكاء الاصطناعي في الفهم المكاني.