في ظل تزايد الحاجة إلى أنظمة فعّالة لإجابات الأسئلة المتعلقة بالوثائق الطويلة، تقدم الدراسة الجديدة الرائدة مفهومًا مبتكرًا يغيّر كيفية تعامل هذه الأنظمة مع النصوص. فبدلاً من الاعتماد على تسلسل مسطح أو تقنيات تجزئة تقليدية، يستند هذا النظام إلى هيكلية تداولية عميقة تضم بناءً رفيعًا مخصصًا لفهم النصوص. من خلال الاستفادة من نظرية الهيكلية البلاغية (Rhetorical Structure Theory)، يتم تحويل الأشجار التداولية إلى تمثيلات على مستوى الجمل، مما يعزز الربط بين المعلومات الهيكلية والدلالية.

تتوصل هذه الدراسة إلى ثلاث ابتكارات رئيسية: أولا، تحليل تداولي عالمي لللغات يساعد في التعامل مع الوثائق الكبيرة بسهولة. ثانيا، تنفيذ تعزيز يعتمد على نماذج اللغات الضخمة (Large Language Models) لتحسين تمثيل نقاط العلاقات التداولية. ثالثا، استرجاع هيراركي مُؤَطَّر يسهل فهم النص على نحو أفضل.

أجريت تجارب شاملة على أربعة مجموعات من البيانات، وجاءت النتائج لتؤكد تفوق هذا الأسلوب على الطرق التقليدية لعدة أنواع لغوية. كما يظهر الإطار المقترح قدرة عالية على التكيف والقوة عبر مجموعة متنوعة من أنواع الوثائق والبيئات اللغوية. في النهاية، يسهم هذا البحث في تطوير أنظمة تساعد على تحسين الفهم الذاتي للنصوص والتفاعل معها، مما يعيد تشكيل مستقبل أنظمة الإجابة على الأسئلة.