في عالم البيانات المتزايد التعقيد، تفشل العديد من أنظمة تحويل النص إلى SQL في تحقيق النتائج المرجوة بسبب فقدان السياق الصحيح للمخطط. فمع وجود الآلاف من الجداول والأعمدة الغامضة والمعايير غير الرسمية، يمكن أن تصبح العملية معقدة بشكل سريع. لكن هناك بصيص من الأمل: تقنيتنا الجديدة المسماة استرجاع المخطط الأول (Schema-First Retrieval).

تعمل استرجاع المخطط الأول على إدماج بيانات الكتالوج بدلاً من الاعتماد على صفوف المستودع التقليدية. حيث تقوم هذه التقنية بترتيب خمسة أنواع من كائنات الكتالوج، بما في ذلك الجداول، الأعمدة، المعايير، العلاقات، وسجل الاستعلامات، مستخدمة قوالب نصية مخصصة لكل كائن. عند تنفيذ الاستعلامات، تمزج هذه التقنية بين البحث المتوازي، توسيع النسب، إعادة ترتيب النتائج عبر الموصلات، ذاكرة العمل، ونقاط الوصول القابلة للتحديد، مما يزيد من فعالية توليد SQL.

تظهر نتائج الاختبارات على مجموعات بيانات مثل CRUSH4SQL وSEDE وBIRD تحسيناً ملحوظاً، حيث وصلت دقة تذكر الجداول إلى 96.4% مع زيادة كبيرة في دقة تذكر الأعمدة. ونتيجة لذلك، انخفضت أخطاء تنفيذ SQL بشكل كبير، مما يوضح أن اختيار الكتالوج يعد قضية أساسية لاسترجاع البيانات بلغة طبيعية.

تومئ نتائج هذه التقنية إلى حقبة جديدة من أدوات تحليل البيانات التي تعد بإحداث تغييرات جذرية في كيفية تعامل المؤسسات مع البيانات، مما يجعل من الضروري النظر في استراتيجيات جديدة للتعامل مع تعقيدات البيانات الحديثة.