مؤخراً، تم تقديم نموذج SIRIUS-SQL، الذي يمثل خطوة ثورية في تحسين عملية تحويل النص إلى استعلامات SQL (Text-to-SQL) في قواعد البيانات المعقدة. تعاني أنظمة التحويل التقليدية من كفاءة ضعيفة في الشروط المعقدة، حيث تعتمد الكثير منها على تمرير واحد فقط، مما يؤدي إلى نتائج غير موثوقة.

لذلك، يذهب SIRIUS-SQL إلى أبعد من ذلك، حيث يقوم بتوليد عدة مرشحات SQL ويستخدم التصويت لإزالة الأخطاء. لكن هذا غير كافٍ، إذ أن هناك ثلاث نقاط ضعف مرتبطة بهذا النهج:
1. تكرار النتائج، حيث يؤدي أخذ عينات متزايدة من مولد واحد إلى الحصول على نتائج مكررة.
2. عدم الدقة في إصلاح الأخطاء، حيث يتم تطبيق تصحيح عام على جميع النتائج، مما يفوت الفرق بين الأخطاء الناتجة عن التنفيذ، مثل الغلق الزمني أو النتائج الفارغة.
3. الاعتماد على زوايا واحدة مثل التصويت على الأغلبية، مما يفتقد لاكتشاف مشكلات أخرى.

من خلال استخدام خوارزمية التعلم المعزز (RL)، يقوم SIRIUS-32B بتوليد مرشحات SQL قابلة للتنفيذ بشكل متنوع، مدعومة بنموذج لغوي شامل يتمتع بالقدرة على سد الفجوات التي قد يتسبب بها الاختصاص. يتم تصنيف كل نتيجة من خلال دورة حياة قائمة على التنفيذ، حيث يتم تطبيق إصلاح مستهدف قبل إعادة النتائج إلى المجموعة.

كما يستخدم SIRIUS-SQL مُحدِّد هجين يربط بين توافق نتائج التنفيذ والحكم على هيكلة SQL معاً. وبفضل هذا الابتكار، سجل النموذج نتائج مذهلة، حيث حقق دقة تصل إلى 75.88% على مجموعة بيانات BIRD و91.20% على مجموعة SPIDER. تفوق النموذج أيضًا على نظام Agentar-Scale-SQL، الذي يعد من أقوى الأنظمة متعددة المرشحات المنشورة.

ما رأيكم في هذا التطور في عالم معالجة البيانات؟ شاركونا برأيكم في التعليقات!