في عالم الذكاء الاصطناعي، تعتبر [الكفاءة](/tag/الكفاءة) الزمنية واحدة من أكثر العوامل أهمية، خاصةً في [تطبيقات](/tag/تطبيقات) مثل [تقييم](/tag/تقييم) الاحتيال، حيث يجب أن يتم ذلك في أقل من 2 مللي ثانية. لكن كيف يمكننا [تحقيق](/tag/تحقيق) ذلك في ظل الوضع الحالي؟ تقدم [دراسة جديدة](/tag/[دراسة](/tag/دراسة)-جديدة) [تقنية](/tag/تقنية) مبتكرة تتعامل مع "[نماذج المؤسسة الأساسية](/tag/[نماذج](/tag/نماذج)-المؤسسة-الأساسية) للجداول" (Tabular Foundation [Models](/tag/models) - TFMs).
[النماذج الأساسية](/tag/[النماذج](/tag/النماذج)-الأساسية) الحالية تحتاج إلى وقت يتراوح بين 151-1,275 مللي ثانية عند استخدام وحدات معالجة الرسوم ([GPU](/tag/gpu))، مما يطرح مشكلة كبيرة في العديد من [التطبيقات](/tag/التطبيقات). هنا يأتي دور [الابتكار](/tag/الابتكار) الجديد، حيث يتم [تقطير](/tag/تقطير) [نماذج المؤسسة الأساسية](/tag/[نماذج](/tag/نماذج)-المؤسسة-الأساسية) إلى [نماذج خفيفة](/tag/[نماذج](/tag/نماذج)-خفيفة) مثل [XGBoost](/tag/xgboost) أو CatBoost، والتي تعمل بسلاسة على وحدات المعالجة المركزية (CPU).
التحدي الرئيسي الذي واجه [الباحثين](/tag/الباحثين) كان يتعلق بالتعلم في [السياق](/tag/السياق) (In-Context Learning - ICL)، والذي يميل إلى تسريب التسميات عند [تقييم](/tag/تقييم) مجموعة [التدريب](/tag/التدريب) الخاصة بهم، مما يؤدي إلى فقدان [المعلومات](/tag/المعلومات) الهيكلية اللازمة للتقطير. مع ذلك، [تمكن](/tag/تمكن) الباحثون من [تطوير](/tag/تطوير) طريقة لتجنب ذلك باستخدام "[تصنيف](/tag/تصنيف) الطبقات الخارجية" (Stratified Out-of-Fold) لتجنب تسريب [المعلومات](/tag/المعلومات).
النتائج كانت مثيرة للإعجاب: [عبر](/tag/عبر) 153 [مجموعة بيانات](/tag/مجموعة-[بيانات](/tag/بيانات)) تصنيفية، سمح [تقطير](/tag/تقطير) TabICLv2 إلى [XGBoost](/tag/xgboost) بتحقيق مدى قدرته (Macro-Mean AUC) بلغ 0.882 بسرعة 1.9 مللي ثانية على الـ CPU، مسجلاً تحسنًا بين 38 إلى 860 مرة مقارنة بالنماذج السابقة. هذا بجانب النتائج الأخرى التي تشير إلى أن [تصنيف](/tag/تصنيف) المعلم ينتقل بدقة إلى [تصنيف](/tag/تصنيف) الطالب، ما يوفر فائدة كبيرة في [البيانات](/tag/البيانات) ذات الأبعاد المنخفضة.
لا تنتهي [الابتكارات](/tag/الابتكارات) عند هذا الحد، إذ كشفت [الدراسة](/tag/الدراسة) أيضاً أن استخدام متوسط لأكثر من معلم يمكن أن يعزز [أداء](/tag/أداء) الطلاب من [نماذج متعددة](/tag/[نماذج](/tag/نماذج)-متعددة) الطبقات، لكن هذا التأثير كان أقل على الطلاب من [نماذج الأشجار](/tag/[نماذج](/tag/نماذج)-[الأشجار](/tag/الأشجار)). وتبين أن في المهام ذات الأبعاد العالية، يمكن أن تكون عملية [التقطير](/tag/التقطير) غير فعالة إذا كانت [أداء](/tag/أداء) المعلم نفسه أقل من [نماذج](/tag/نماذج) [CatBoost](/tag/catboost).
كخلاصة، هذه [الدراسة](/tag/الدراسة) تعكس [الابتكار](/tag/الابتكار) المستمر في مجال [الذكاء الاصطناعي](/tag/الذكاء-الاصطناعي) وقدرة [الباحثين](/tag/الباحثين) على [تحسين](/tag/تحسين) القدرات [العملية](/tag/العملية) للنماذج بشكل مذهل. وقد تم فتح كامل عملية [التطوير](/tag/التطوير) كمصدر مفتوح كجزء من مكتبة "TabTune"، مما يسهل وصول [المطورين](/tag/المطورين) والباحثين لهذه التقنيات. ما رأيكم في هذه التطورات المثيرة؟ شاركونا في [التعليقات](/tag/التعليقات).
نماذج المؤسسة الرائعة: تحويل النماذج الأساسية إلى شجرة تعزيزية جاهزة لوحدات المعالجة المركزية!
تقدم دراسة جديدة طريقة مبتكرة لتحسين أداء النماذج الأساسية للجداول عبر تحويلها إلى نماذج خفيفة وسريعة. هذا التحول يعد ثورة في عالم الذكاء الاصطناعي مع تحقيق نتائج مذهلة.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←# أبحاث# معدات الذكاء الاصطناعي# نموذج جيب النماذج الأساسية# XGBoost# CatBoost# الذكاء الاصطناعي# نماذج المؤسسة الأساسية# تقطير النماذج# دراسة جديدة
جاري تحميل التفاعلات...
