في عالم الذكاء الاصطناعي، تعد النماذج اللغوية الكبيرة (Large Language Models) هي الرائدة في مجال توليد استعلامات SQL من النصوص. إلا أن هذه النماذج تُواجه تحديات كبيرة مثل التكاليف العالية، وفترات الانتظار الطويلة، والمخاوف المتعلقة بخصوصية البيانات، مما يجعل استخدامها غير عملي في كثير من التطبيقات الواقعية. وهنا يبرز الدور الحيوي للنماذج اللغوية الصغيرة (SLMs) التي تسمح بالتطبيق الفعال والمحلي.
ومع ذلك، يواجه الـ SLMs صعوبات في جوانب مثل التفكير الضعيف والمتابعة السيئة للتعليمات. الطرق التقليدية للتعلم بالاعتماد على المكافآت الثنائية النادرة (0/1) تقدم إشارات تعلم ضعيفة عندما تكون الاستعلامات المولدة غير صحيحة، مما يؤدي إلى تدريب غير مستقر أو منهار.
وللتغلب على هذه المشكلات، تم تقديم إطار عمل مُبتكر تحت اسم FINER-SQL، الذي يعد قابلًا للتوسع وإعادة الاستخدام ويعزز أداء الـ SLMs من خلال تقديم ملاحظات تنفيذ دقيقة. يعتمد FINER-SQL على تحسين السياسة النسبي الجماعي ويستبدل الإشراف النادر بمكافآت كثيفة قابلة للتفسير تقدم ملاحظات مستمرة حتى في حالة الاستعلامات غير الصحيحة.
تتضمن هذه التقنية وظيفتي مكافأة رئيسيتين:
1. **مكافأة الذاكرة**: تهدف إلى مواءمة التفكير مع المسارات المعتمدة لضمان استقرار المعاني.
2. **مكافأة ذرية**: تقيس تقارب مستوى العمليات لمنح نقاط جزئية للاستعلامات الهيكلية الصحيحة ولكن غير المكتملة.
تتحول هذه الاستراتيجيات من دقة التحقق الثابتة إلى التعلم المستمر، مما يمكّن من تحسين مستقر وخالٍ من النقاد. في التجارب على معايير مثل BIRD وSpider، أظهر FINER-SQL دقة تنفيذ تصل إلى 67.73% و85% باستخدام نموذج 3B، متطابقًا مع أداء النماذج الأكبر وبنفس الوقت تقليل زمن الاستدلال إلى 5.57 ثانية لكل عينة. هذه النتائج تُبرز مساراً فعالاً من حيث التكلفة ويحفظ الخصوصية نحو تحقيق أداء عالٍ في توليد استعلامات SQL.
FINER-SQL: تعزيز النماذج اللغوية الصغيرة في تحويل النصوص إلى استعلامات SQL
تقدم تقنية FINER-SQL بديلاً فعالًا من حيث التكلفة في عالم تحويل النصوص إلى استعلامات SQL، مما يعزز من أداء النماذج اللغوية الصغيرة (SLMs) عبر تقديم ملاحظات تنفيذ دقيقة. النتائج تُظهر دقة تنفيذ تصل إلى 85%، مما يشير إلى تحول جذري في هذا المجال.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
