في عالم الذكاء الاصطناعي، يعد [التفكير](/tag/التفكير) المكاني والزماني أحد المجالات الحيوية التي تتطلب [دقة](/tag/دقة) وعمقًا في الفهم. لذلك، أعلن الباحثون مؤخرًا عن إطلاق معيار QSTRBench، وهو معيار شامل يهدف إلى [تقييم](/tag/تقييم) قدرة [نماذج [اللغة](/tag/اللغة) الكبيرة](/tag/[نماذج](/tag/نماذج)-[اللغة](/tag/اللغة)-الكبيرة) (Large Language [Models](/tag/models)) على معالجة الأسئلة المعقدة المتعلقة بالتفكير المكاني والزماني.

يتضمن المعيار أسئلة تتعلق بالتفكير التراكمي باستخدام جداول التركيب (Composition Tables) والعلاقات المتبادلة (Converse Relations) والمجاورات المفاهيمية (Conceptual Neighbourhoods) ضمن [عدد](/tag/عدد) من حسابات QSTR. يركز المعيار على عدة [نماذج رياضية](/tag/[نماذج](/tag/نماذج)-[رياضية](/tag/رياضية)) مثل [حساب](/tag/حساب) النقاط (Point Algebra)، وحساب فترات ألين (Allen's Interval Algebra)، وعدد من حسابات الاتصال الإقليمي (RCC) مثل RCC-5 وRCC-8 وRCC-22.

[جديد](/tag/جديد) هذا المعيار هو تقديم منطقة الجوار المفاهيمي RCC-22 لأول مرة، مما يعكس تطورًا ملحوظًا في مجال التفكر المكاني. كما يتيح المعيار للمستخدمين تقديم الأسئلة بطرق مختلفة، مما يضيف طبقات جديدة من التحدي والتحليل.

على الرغم من أن جميع [النماذج](/tag/النماذج) التي تم اختبارها أثبتت أداءً أفضل من التخمين، إلا أنها لا تزال تعاني من القدرة على الإجابة بدقة عن جميع الأسئلة. [الأداء](/tag/الأداء) يختلف بشكل ملحوظ حسب نوع [الحساب](/tag/الحساب)؛ حيث يعتبر [حساب](/tag/حساب) النقاط (PA) الأسهل بينما يعتبر RCC-22 الأكثر تعقيدًا.

جنبًا إلى جنب مع إطلاق المعيار، تم [نشر](/tag/نشر) النتائج تحت [ترخيص](/tag/ترخيص) مفتوح، مما يشجع المجتمع البحثي على مزيد من [التحليل](/tag/التحليل) والتقييم لاستنتاجات [التفكير](/tag/التفكير) المكاني والزماني في [نماذج [اللغة](/tag/اللغة) الكبيرة](/tag/[نماذج](/tag/نماذج)-[اللغة](/tag/اللغة)-الكبيرة). هل تعتقد أن هذا المعيار سيساهم في [تحسين](/tag/تحسين) [قدرات الذكاء الاصطناعي](/tag/قدرات-الذكاء-الاصطناعي)؟ شاركنا رأيك بالأسفل!