في عالم تكنولوجيا البيانات وتحليلها، تتجه الأبحاث الحديثة نحو أساليب جديدة لمعالجة تحديات التصنيف. في ورقتنا الجديدة، نركز على تصنيف الحالات التي تم تمثيلها من خلال توزيعات على فضاء المتجهات بدلاً من النقاط الفردية. إن استخدام خوارزميات التصنيف المعتمدة على المسافات الثنائية هو محور بحثنا، حيث نركز على مقياس فاسرشتاين (Wasserstein Metric) بين هذه التوزيعات.

تستند دراستنا إلى تحقيق تخفيض الأبعاد داخل مجال مقياس فاسرشتاين، مما يسهم في تحسين دقة التصنيف. نقدم مقاربة مبتكرة تعتمد على مبدأ تعظيم النسبة الفيشرية (Fisher's ratio)، والتي تُعرف بأنها النسبة بين تباين الفئات المختلفة إلى تباين الفئات داخل المجموعة الواحدة. وتسمى الاتجاهات التي يتم فيها تعظيم هذه النسبة بالمحاور التمييزية أو متجهات المعايير الكانونية.

في الممارسة العملية، يتم تعريف كل من تباينات بين الفئات وداخلها كمتوسط المسافات المربعة لمقياس فاسرشتاين بين أزواج من التوزيعات، سواء كانت هذه الأزواج تنتمي لنفس الفئة أو لفئات مختلفة. يتم تحقيق تحسين هذه النسبة من خلال خوارزمية تكرارية تتناوب بين خطوات النقل المثلى (Optimal Transport) وخطوات التعظيم داخل فضاء المتجهات.

تجري الدراسات التجريبية لتقييم تقارب الخوارزمية؛ وتظهر النتائج التجريبية أن تقنية تخفيض الأبعاد تحسن الأداء في التصنيف بشكل ملموس. علاوة على ذلك، تتفوق الطريقة الجديدة على خوارزميات معروفة تعمل على تمثيلات المتجهات المستمدة من البيانات التوزيعية، وتستخدم بنجاح حتى مع اختلاف كيفية تلخيص الحالات بواسطة التوزيعات، مثل عدد المكونات في نموذج المزيج الغاوسي (GMM).

إن هذا البحث يفتح أفقًا جديدًا في كيفية التعامل مع بيانات التوزيع، مما يجعل التصنيف أكثر دقة وفعالية. هل تعتقد أن هذه الأساليب يمكن أن تغير مستقبل تحليل البيانات؟ شاركونا آراءكم في التعليقات.