في عصر المعلومات الضخمة، أصبح استرجاع الجداول ذات الصلة من قواعد البيانات الواسعة خطوة أساسية للإجابة بدقة على الاستفسارات، لا سيما في مهام مثل تحويل النص إلى SQL (Text-to-SQL). تستخدم الطرق التقليدية لاسترجاع الجداول مجموعة محددة مسبقاً من الجداول (k tables) الأكثر تشابهاً مع الاستعلام. لكن المشكلة الكبرى تكمن في أن عدد الجداول المطلوبة يختلف باختلاف الاستفسارات، ولا يمكن معرفته مسبقاً.

فرض رقم ثابت من الجداول المسترجعة، بغض النظر عن الاستعلام، قد يؤدي إلى الحصول على مجموعة صغيرة غير مكتملة، وهو ما يعرض المستخدم لفقدان المعلومات الضرورية، أو مجموعة كبيرة تضم جداول غير ذات صلة.

لذا، تم اقتراح طريقة جديدة في استرجاع الجداول التكيفية التي تتكيف مع عدد الجداول المسترجعة حسب احتياجات كل استعلام. تعتمد هذه الطريقة على آلية تحديد عتبة تكيفية (adaptive thresholding) لاسترجاع الجداول بشكل انتقائي، وتدمج خوارزمية تصنيف متحركة (sliding-window reranking) لمعالجة مجموعة كبيرة من الجداول بكفاءة.

تشير التجارب الواسعة على مجموعات بيانات مثل Sider وBIRD وSpider 2.0 إلى أن هذه الطريقة تعالج بشكل فعّال القيود المتعلقة باستراتيجية استرجاع الجداول التقليدية، مما يحسن الأداء في الاسترجاع والمهام اللاحقة. لمزيد من التفاصيل، يمكنكم الاطلاع على الكود والبيانات المتاحة على موقع GitHub.

ما رأيكم في هذا الابتكار القادر على تغيير طريقة استرجاع البيانات؟ شاركونا في التعليقات!