في عالم البيانات الحديثة، تحتوي قواعد البيانات العلائقية (Relational Databases - RDB) على كميات هائلة من المعلومات الجدولية المتنوعة التي يمكن استخدامها لأغراض النمذجة التنبؤية. لكن مع تعدد الأهداف المحتملة، كيف يمكننا تجنب إعادة تدريب نموذج جديد في كل مرة نرغب فيها في توقع كمية جديدة؟ هنا تظهر نماذج التعلم في سياقات الذاكرة (In-Context Learning - ICL) كخيار مناسب، لكن حتى الآن، كانت هذه النماذج محدودة بشكل كبير في التعامل مع بيانات من جداول واحدة فقط.
لتوسيع نطاق هذه النماذج لتشمل جداول مرتبطة متعددة، من الضروري ضغط أحياء قواعد البيانات العلائقية ذات الأحجام المتغيرة إلى عينات ICL ثابتة الطول يتم استهلاكها بواسطة وحدات التشفير. لكن التفاصيل هنا حرجة: على عكس خطوط البيانات في التعلم الخاضع للإشراف الحالية، نقدم دلائل نظرية وبيانية على أن الضغط الخاص بـ ICL يجب أن يكون مقيداً ضمن أعمدة RDB عالية الأبعاد حيث تشترك جميع الكيانات في الوحدات والأدوار. هذا بينما تكون الأبعاد عبر الأعمدة الأخرى غير محددة تماماً دون معلومات تسميات واسعة النطاق.
مع وضع هذه القيود في الاعتبار، نوضح أن تعبير وحدة التشفير لا يتأثر سلباً باستبعاد معلمات قابلة للتدريب. وبالتالي، تمكنّا من الوصول إلى عائلة مبدئية من وحدات تشفير قواعد البيانات العلائقية التي يمكن ربطها بسلاسة مع نماذج ICL التي تعتمد على جدول واحد، مما يعني أنه لا حاجة لتدريب أو تحسين.
من الناحية العملية، طورنا أساليب SQL قابلة للتوسع لتنفيذ مرحلة التشفير، مما أدى إلى إنشاء نموذج RDBLearn المفتوح المصدر القادر على تقديم أداء قوي على مجموعات البيانات غير المعروفة بسهولة، ودون الحاجة إلى عمليات معقدة.
هل تحتاج حقاً لتدريب نموذج قاعدة البيانات العلائقية؟ اكتشف الإجابة الآن!
تقدم الدراسة الجديدة طريقة مبتكرة لاستخدام نماذج التعلم في سياقات الذاكرة في قواعد البيانات العلائقية دون الحاجة لإعادة تدريب. تعرف على خطوات إنشاء نماذج فعالة بسهولة.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
