في عالم الذكاء الاصطناعي الحديث، تبرز الحاجة الملحة لتطوير نماذج قوية ومتطورة قادرة على التعامل مع التحديات المتنوعة التي تواجه البيانات. إحدى هذه التحديات هي "تحول التسميات" (Label Shift) الذي يعد عائقًا أساسيًا أمام النماذج القائمة على البيانات الجدولية.

مؤخراً، حقق نموذج TabPFN، الذي يعتمد على التعلم في السياق (In-Context Learning)، نجاحًا لافتًا في معالجة البيانات الجدولية، ولكنه أبدى بعض الضعف عندما يتعلق الأمر بتحول التسميات، حيث كان يميل إلى التكيف بشكل مفرط مع الفئة الأكثر شيوعًا.

لذا، تم طرح حل مبتكر باسم DistPFN، وهو أول طريقة تعديل لاحق مصممة خصيصًا لنماذج البيانات الجدولية في أوقات الاختبار. تعمل DistPFN على إعادة ضبط احتمالات الفئات المتوقعة من خلال تقليل تأثير سابق التدريب (training prior) والتركيز على مساهمة التوزيع السابق للنموذج، مما يجعلها قادرة على تحسين دقة التوقعات بدون أي تعديلات هيكلية أو تدريب إضافي.

وعلاوة على ذلك، تم إدخال نموذج فرعي باسم DistPFN-T، والذي يستخدم تقنية التحكم في درجة الحرارة (Temperature Scaling) لتكييف قوة التعديل بناءً على التباين بين السابق والمتأخر.

تمت تجربة هذا الابتكار على أكثر من 250 مجموعة بيانات من OpenML، وأظهرت النتائج تحسنًا كبيرًا في أداء نماذج TabPFN في مهام التصنيف تحت تأثير تحول التسميات، مع الحفاظ على أداء قوي في الإعدادات القياسية بدون تحول التسميات.

إذا كنت مهتمًا في فهم كيفية تحسين أداء نماذجك وبحثت عن أفكار جديدة في مجال الذكاء الاصطناعي، فإن متابعتك لتطورات مثل DistPFN ستكون جديرة بالاهتمام. ما رأيكم في هذا التطور؟ شاركونا في التعليقات!