تتطلب [مهارات](/tag/مهارات) [التفكير](/tag/التفكير) الجغرافي (Geospatial Reasoning) القدرة على [حل المشكلات](/tag/حل-المشكلات) المرتبطة بالصور المعززة من خلال الفهم المعقد للهياكل المكانية للبيئة. ومع ذلك، فإن [تطوير](/tag/تطوير) هذه القدرة غالباً ما يواجه عقبات، أبرزها [تكاليف](/tag/تكاليف) تعيين حيز واسع ومعقد من الأسئلة.

هنا تأتي [تقنية](/tag/تقنية) GeoX، التي تقدم إطار [عمل](/tag/عمل) [ذكي](/tag/ذكي) يعتمد على [اللعب الذاتي](/tag/اللعب-الذاتي) (Self-Play)، حيث يتمكن النظام من [تطوير](/tag/تطوير) [منطق](/tag/منطق) [الفضاء](/tag/الفضاء) من خلال [برامج](/tag/برامج) قابلة للتنفيذ تمنح [مكافآت](/tag/مكافآت) يمكن [التحقق](/tag/التحقق) منها دون الاعتماد على [بيانات](/tag/بيانات) مكثفة تم تنظيمها بواسطة البشر.

عند تزويد النظام بصورة فضائية أو جوية، يقوم [إطار العمل](/tag/إطار-العمل) الخاص بنا بتوظيف [سياسة](/tag/سياسة) [متعددة الوسائط](/tag/متعددة-الوسائط) (Multimodal Policy) تقترح مشكلات مكانية على شكل [برامج](/tag/برامج) قابلة للتنفيذ، ويقوم بحلها تحت ثلاثة أوضاع من [التفكير](/tag/التفكير): [الاستدلال](/tag/الاستدلال) (Abduction) والاستنتاج (Deduction) والاستقراء (Induction) باستخدام [أدوات](/tag/أدوات) لفهم [الصور](/tag/الصور).

تقوم وحدة [التحقق](/tag/التحقق) (Verifier) بتنفيذ كل برنامج لتحويل إشارة المكافأة التي تعزز [الأداء](/tag/الأداء) المشترك على أساس [التعلم التعزيزي](/tag/[التعلم](/tag/التعلم)-التعزيزي) ([Reinforcement Learning](/tag/reinforcement-learning)). أظهرت [تقنية](/tag/تقنية) GeoX [تحسينات](/tag/تحسينات) ملحوظة تصل إلى 5.5 نقطة في المتوسط في [نماذج [اللغة](/tag/اللغة) الضخمة](/tag/[نماذج](/tag/نماذج)-[اللغة](/tag/اللغة)-الضخمة) ([VLMs](/tag/vlms)) الأساسية، مما يجعلها تنافس أو تتجاوز الأسس التقليدية التي تم تدريبها على ملايين [البيانات](/tag/البيانات) المنظمة.

بالإضافة إلى الأسلوب المبتكر، نطلق [مجموعة بيانات](/tag/مجموعة-[بيانات](/tag/بيانات)) معيارية لفهم الجغرافيا تم تجميعها من خلال اللعب الذاتي، مما يمثل خطوة هامة [نحو](/tag/نحو) [تحسين الذكاء الاصطناعي](/tag/[تحسين](/tag/تحسين)-الذكاء-الاصطناعي) في الفهم المكاني.