في عالم الذكاء الاصطناعي، أصبح الوصول إلى قواعد البيانات أسهل بكثير بفضل نماذج اللغة الكبيرة (Large Language Models) التي تمكن من تحويل النصوص إلى استعلامات SQL. لكن الانتقال من نموذج تجريبي إلى إنتاجي يبقى تحديًا كبيرًا، حيث يحتاج التنفيذ الفعلي إلى التعامل مع لهجات SQL الصارمة، وهياكل البيانات الضخمة، وتفضيلات المستخدمين المتغيرة.

تقدم مشروع Tahoe نهجًا مبتكرًا لمواجهة هذه التحديات من خلال اعتبار تحسين التعليمات (prompt optimization) كمشكلة ديناميكية لإدارة البيانات. يعتمد Tahoe على أنظمة تعلم الإشارات المدفوعة بالأخطاء، حيث يتم تجميع آثار التصحيح في بنك إشارات منظم. ويتم تقطير ملاحظات الكمبايلر إلى إشارات نحوية قابلة لإعادة الاستخدام تتعلق بالقواعد الخاصة باللهجات، بينما يتم تحويل ردود الفعل التنفيذية وملاحظات المستخدم إلى إشارات دلالية تتعلق بالمنطق الخاص بالهياكل وتفضيلات المستخدمين.

يضيف Tahoe أيضًا طبقة استراتيجية تقوم بنمذجة نوايا المستخدم المتضاربة كاستراتيجيات تتنافس تحت مؤشرات لغوية طبيعية مشتركة، مع إشارات حديثة وإحصائيات الاستدلال بعد التعلم التي تلخص النجاح والخطر والسكون والدعم التجريبي.

خلال مرحلة الاستدلال، يقوم Tahoe باسترجاع الإشارات ذات الصلة وإرشاد نموذج اللغة الكبيرة خلال تخطيط المنطق يتبعه تركيب SQL.

لقد أظهرنا ونفذنا سير عمل Phase Development، تاركين تحديثات ردود الفعل البشرية خلال مرحلة النشر للعمل المستقبلي. في اختبار Spider 2.0-Snow، تمكن Tahoe من تحسين أداء تحويل النص إلى SQL بشكل كبير دون تحديث معلمات النموذج، حيث ارتفعت نسبة النجاح من 61.95% إلى 79.42%، وحققت نسبة نجاح بنسبة 100% في قواعد Snowflake.

تعتبر هذه التطورات جواز سفر نحو تحسين تجربة المستخدم في الوصول إلى البيانات بطريقة أكثر فعالية وديناميكية.

هل تعتقد أن مثل هذه الأنظمة ستغير طريقة تعاملنا مع البيانات في المستقبل؟ شاركونا آرائكم في التعليقات!