أصبح من الواضح أن نماذج اللغة الضخمة (Large Language Models) ونماذج الرؤية واللغة (Vision-Language Models) تؤدي دورًا متزايد الأهمية في معالجة وظيفية الجداول. إلا أن العديد من المعايير والتقييمات الحالية لم تعالج بعد كيفية تأثير تمثيل الجداول على الأداء.

هنا يأتي دور ما يُعرف بـ TABVERSE، وهو معيار متعدد الوسائط يهدف إلى دراسة تأثير تمثيل الجداول على فهمها من خلال برامج الذكاء الاصطناعي. ما يميز TABVERSE هو أنه يعمل على مواءمة نفس المحتوى الجدولي عبر تنسيقات هيكلية متعددة مثل HTML وMarkdown وLaTeX، وكذلك من خلال الصور المصورة، عن طريق إضافة تصنيفات للأسئلة ومستويات الصعوبة.

يسمح هذا التصميم المتكامل بتقييم منظم لفهم الجداول، حيث يبقى المحتوى ثابتًا، مما يُمكّن الباحثين من عزل تأثيرات التمثيل. وقد تم تقييم نماذج LLMs وVLMs عبر ثلاث مهام رئيسية: الإجابة على الأسئلة، القدرة على فهم البنية، وإعادة بناء الهيكل.

نتائج هذا البحث تبين أن خيارات التمثيل تؤثر بشكل كبير على فهم الجداول. النماذج عمومًا تقدم أداءً أفضل عندما تتعامل مع نصوص هيكلية مقارنة بصور الموضع، لكن الفجوة في الأداء تعتمد على المهمة، النموذج، والصيغة المعتمدة. ومن المثير للاهتمام أن HTML تُظهر أنها الأكثر قوةً كصيغة نصية، في حين تظل المهام الحساسة للبناء والتحديات في إعادة بناء نص LaTeX تمثل نقاط تحدي.

تؤكد هذه النتائج على أن طريقة تمثيل الجداول هي عنصر أساسي في تقييم موثوقية الفهم الجدولي، مما يفتح الأبواب نحو آفاق جديدة في أبحاث الذكاء الاصطناعي. كيف تعتقد أن سيكون مستقبل فهم الجداول في الذكاء الاصطناعي؟ شاركونا آرائكم في التعليقات!