في عالم الذكاء الاصطناعي، تعتبر [الكفاءة](/tag/الكفاءة) الزمنية واحدة من أكثر العوامل أهمية، خاصةً في [تطبيقات](/tag/تطبيقات) مثل [تقييم](/tag/تقييم) الاحتيال، حيث يجب أن يتم ذلك في أقل من 2 مللي ثانية. لكن كيف يمكننا [تحقيق](/tag/تحقيق) ذلك في ظل الوضع الحالي؟ تقدم [دراسة جديدة](/tag/[دراسة](/tag/دراسة)-جديدة) [تقنية](/tag/تقنية) مبتكرة تتعامل مع "[نماذج المؤسسة الأساسية](/tag/[نماذج](/tag/نماذج)-المؤسسة-الأساسية) للجداول" (Tabular Foundation [Models](/tag/models) - TFMs).

[النماذج الأساسية](/tag/[النماذج](/tag/النماذج)-الأساسية) الحالية تحتاج إلى وقت يتراوح بين 151-1,275 مللي ثانية عند استخدام وحدات معالجة الرسوم ([GPU](/tag/gpu))، مما يطرح مشكلة كبيرة في العديد من [التطبيقات](/tag/التطبيقات). هنا يأتي دور [الابتكار](/tag/الابتكار) الجديد، حيث يتم [تقطير](/tag/تقطير) [نماذج المؤسسة الأساسية](/tag/[نماذج](/tag/نماذج)-المؤسسة-الأساسية) إلى [نماذج خفيفة](/tag/[نماذج](/tag/نماذج)-خفيفة) مثل [XGBoost](/tag/xgboost) أو CatBoost، والتي تعمل بسلاسة على وحدات المعالجة المركزية (CPU).

التحدي الرئيسي الذي واجه [الباحثين](/tag/الباحثين) كان يتعلق بالتعلم في [السياق](/tag/السياق) (In-Context Learning - ICL)، والذي يميل إلى تسريب التسميات عند [تقييم](/tag/تقييم) مجموعة [التدريب](/tag/التدريب) الخاصة بهم، مما يؤدي إلى فقدان [المعلومات](/tag/المعلومات) الهيكلية اللازمة للتقطير. مع ذلك، [تمكن](/tag/تمكن) الباحثون من [تطوير](/tag/تطوير) طريقة لتجنب ذلك باستخدام "[تصنيف](/tag/تصنيف) الطبقات الخارجية" (Stratified Out-of-Fold) لتجنب تسريب [المعلومات](/tag/المعلومات).

النتائج كانت مثيرة للإعجاب: [عبر](/tag/عبر) 153 [مجموعة بيانات](/tag/مجموعة-[بيانات](/tag/بيانات)) تصنيفية، سمح [تقطير](/tag/تقطير) TabICLv2 إلى [XGBoost](/tag/xgboost) بتحقيق مدى قدرته (Macro-Mean AUC) بلغ 0.882 بسرعة 1.9 مللي ثانية على الـ CPU، مسجلاً تحسنًا بين 38 إلى 860 مرة مقارنة بالنماذج السابقة. هذا بجانب النتائج الأخرى التي تشير إلى أن [تصنيف](/tag/تصنيف) المعلم ينتقل بدقة إلى [تصنيف](/tag/تصنيف) الطالب، ما يوفر فائدة كبيرة في [البيانات](/tag/البيانات) ذات الأبعاد المنخفضة.

لا تنتهي [الابتكارات](/tag/الابتكارات) عند هذا الحد، إذ كشفت [الدراسة](/tag/الدراسة) أيضاً أن استخدام متوسط لأكثر من معلم يمكن أن يعزز [أداء](/tag/أداء) الطلاب من [نماذج متعددة](/tag/[نماذج](/tag/نماذج)-متعددة) الطبقات، لكن هذا التأثير كان أقل على الطلاب من [نماذج الأشجار](/tag/[نماذج](/tag/نماذج)-[الأشجار](/tag/الأشجار)). وتبين أن في المهام ذات الأبعاد العالية، يمكن أن تكون عملية [التقطير](/tag/التقطير) غير فعالة إذا كانت [أداء](/tag/أداء) المعلم نفسه أقل من [نماذج](/tag/نماذج) [CatBoost](/tag/catboost).

كخلاصة، هذه [الدراسة](/tag/الدراسة) تعكس [الابتكار](/tag/الابتكار) المستمر في مجال [الذكاء الاصطناعي](/tag/الذكاء-الاصطناعي) وقدرة [الباحثين](/tag/الباحثين) على [تحسين](/tag/تحسين) القدرات [العملية](/tag/العملية) للنماذج بشكل مذهل. وقد تم فتح كامل عملية [التطوير](/tag/التطوير) كمصدر مفتوح كجزء من مكتبة "TabTune"، مما يسهل وصول [المطورين](/tag/المطورين) والباحثين لهذه التقنيات. ما رأيكم في هذه التطورات المثيرة؟ شاركونا في [التعليقات](/tag/التعليقات).