في عالم يتطلب فيه القطاع التجاري والطب والرصد المحتوى دقة عالية وموثوقية، تظهر الحاجة الملحة لنماذج تعلم الآلة (Machine Learning) القابلة للفهم. يعد ذلك ضرورة أساسية، حيث يتوجب على الممارسين تحليل الميزات التي تؤثر في قرارات النماذج المطبقة. ومع ذلك، فإن البيانات المتاحة تأتي في غالبها كمواد غير منظمة، مما يجعل استخراج الميزات منها تحديًا حقيقيًا.

يعمل نظام FEST (هندسة الميزات باستخدام الأشجار المتطورة ذاتيًا) على حل هذه الإشكالية بطريقة مبتكرة. من خلال دمج طريقتين لتوليد الميزات: إحداهما تعتمد على الدلالات النصية والأخرى على المعلومات المحددة، يسهم FEST في اكتشاف ميزات يمكن تتبعها من النصوص والصور الخام.

أثبت نظام FEST تفوقه في 17 من أصل 20 مجموعة من المهام التصنيفية، بما في ذلك تصنيف العلامات وكشف المحتوى الأصيل واكتشاف الضغوط، حيث حقق متوسط زيادة قدره 4.2 نقطة مئوية مقارنة بأقوى النماذج الحالية. ومن خلال تقييم يعتمد على نموذج لغوي كبير (LLM)، أظهر FEST تغطية تتراوح بين 60-80% للميزات المصممة من قبل الخبراء عند قيود المطابقة الدلالية الصارمة.

لضمان تقييم شامل لمطابقة الميزات في الهندسة الآلية، تم إصدار مجموعة بيانات BrandGuide، التي تعد الأولى من نوعها والتي تربط بين الميزات التي صممها الخبراء مع أكثر من مليون أصل عبر 2,683 علامة تجارية.

من خلال ربط الهندسة المعتمدة على الميزات بالمعرفة الخبيرة، يفتح النظام FEST طريقًا عمليًا لتطبيقات الذكاء الاصطناعي القابلة للتفسير في المجالات التي تتطلب إشرافًا بشريًا، مما يجعل من الضروري متابعة هذا التطور.