في عصر تعتمد فيه التحليلات اللغوية على البيانات، تتزايد أهمية فهم الجداول متعددة الأوراق (multi-sheet spreadsheets) المصممة بطريقة معقدة. حيث تكون البيانات غالبًا موزعة عبر أوراق متعددة، مما يتطلب معالجة دقيقة تجمع بين المعاني الكامنة. في هذا السياق، برزت تقنية "Sheet as Token" كإطار عمل مبتكر يسهم في تعزيز استرجاع المعلومات بدقة من خلال تمثيل كل ورقة ككيان دلالي موحد.

تقليديًا، تعتمد الأساليب المستخدمة حاليًا على تقسيم الجداول إلى صفوف أو أعمدة أو كتل، مما يؤدي إلى تفكيك المعلومات الهامة إلى مقاطع نصية متناثرة، مما قد يضعف المعنى الشامل لكل ورقة. ولكن مع "Sheet as Token"، يتم استخراج السجلات المعتمدة على المخطط من أسماء الأوراق، ورؤوس الأعمدة، والقيم التمثيلية، وميزات التخطيط، ثم يتم تشفير كل ورقة في توكن كثيف ومضغوط.

عند تقديم استعلام باللغة الطبيعية، يقوم "Graph Retriever" بإنشاء رسم بياني مخصص يتضمن العلاقات الدلالية، والتوافق مع الاستعلام، وثبات المخطط، وملاءمة الشكل، ثم يستخدم محول رسومي متعدد المراحل لاسترجاع مجموعة أوراق داعمة. تظهر التجارب التي تم إجراؤها على مجموعة بيانات مُنَشأة من الجداول متعددة الأوراق أن تمثيل مستوى الورقة يحقق تمثيلات مستقرة، وأن التفكير المعزز بالرسوم البيانية يُحسن الاسترجاع مقارنةً بأساليب الرسم البياني التقليدية المحدودة.

تشير النتائج إلى أن تقنية "Sheet as Token" تقدم تجريدًا واعدًا لفهم الجداول متعددة الأوراق بفعالية، مما يمهد الطريق لأدوات تحليل بيانات أكثر قوة ودقة.