في عالم الذكاء الاصطناعي، تُعد نماذج الأساس الجدولية (Tabular Foundation Models) من الأدوات المهمة، حيث بدأت تتفوق على الطرق التقليدية مثل الأشجار المعززة المتدرجة (Gradient-Boosted Trees) في مجموعة متنامية من المهام. ومع ذلك، تواجه هذه النماذج تحديًا، حيث لا يوجد نموذج واحد يمكن أن يجمع كل الأفضليات ويحقق النجاح في جميع المجالات.

عند النظر في استراتيجيات التحسين، تعتبر الجمع بين النماذج (Ensembling) إحدى الحلول التقليدية المتبعة، لكن النتائج جاءت أقل من المتوقع. فقد أوجدت دراسة تحليلية لمجموعة من ستة نماذج حديثة، أن هذه النماذج تشكل مجموعة شبه زائدة، حيث تُظهر القيم المقارنة (Q-statistic) قرابة 0.961، مما يعني أن أي توليفة مقترحة ستكون محصورة في مستويات معينة.

لقد قمنا باختبار ست استراتيجيات جماعية على هذه النماذج الستة في 153 مهمة تصنيف متوفرة عبر OpenML. وما أثار الانتباه هو أن أفضل استراتيجية جماعية، وهي الطريقة ذات التسلسل المزدوج (Two-level Cascade Stacking)، حسنت دقة النتيجة بنسبة 0.18% فقط، بينما تطلب ذلك 253 ضعف حجم الطاقة الحاسوبية المستخدمة.

وبينما وجدت تحليلات مثل تحليل فريدمان ونيميني (Friedman and Nemenyi) أن ثلاث مجموعات جماعية تجتمع مع أفضل نموذج أساسي، كان هناك أيضًا ثلاث استراتيجيات أخرى أسوأ من النموذج الأساسي. من اللافت أن استخدام نموذج تعلم الآلة على أساس الانحدار اللوجستي (Logistic Regression Meta-learner) أثبت أنه أكثر الحالات تميزًا، حيث قدم دقة تنافسية لكن بتصنيف سيء على مستوى القيم اللوجستية.

أوصى الباحثون بإجراء الاختيار الجشع (Greedy Selection) كخيار عملي للمبتدئين في هذا المجال لتحسين الأداء.

في النهاية، يعد الجمع بين النماذج خيارًا مثيرًا لكنه يتطلب تجارب دقيقة لفهم تأثير التنوع والتوافق. هل أنتم مع هذه الرؤية حول نماذج الأساس الجدولية؟ شاركونا آرائكم في التعليقات.