في عصر الدراسات الفلكية الحديثة، تعتبر التوقيعات الطيفية للأشعة السينية (X-ray spectra) محورية لفهم الظواهر الكونية. لذا، يأتي هذا البحث ليقدم منظورًا جديدًا حول كيفية استخدام تقنيات التعلم العميق (Deep Learning) لاستخراج تمثيلات كامنة من بيانات الأشعة السينية الخاصة بمصادر شاندرا (Chandra).

الهدف من هذا العمل هو تطوير تمثيل مضغوط ومفهوم فيزيائي لطيف الأشعة السينية باستخدام تقنيات التعلم العميق. لقد أظهرت الأساليب الآلية في تعلم الآلة فاعليتها، لكنها لم تستخدم حتى الآن على نطاق واسع في مجموعات البيانات الطيفية الكبيرة مثل كتالوج مصادر شاندرا (Chandra Source Catalog).

تتبعت الدراسة كيفية تقييم التمثيل المستخرج من الطيف عن طريق تطبيق التحليل التصنيفي (Classification)، والانحدار (Regression)، وتحليلات القابلية للتفسير (Interpretability)، كما تم قياس المعلومات المتبادلة بين الخصائص الطيفية والزمنية لهذه المصادر.

باستخدام نموذج أوتوكودر مبني على محولات (Transformer-based Autoencoder)، تمت ضغط طيف الأشعة السينية إلى تمثيلات ضمن فضاء كامني أبعاده ثمانية. تم تجميع أنواع المصادر الفلكية والإحصائيات الفيزيائية من كتالوجات خارجية، حيث تم تقييم جودة التمثيل المستخرج من خلال دقة إعادة بناء الطيف، وأداء المجموعات على ثمانية فئات معروفة من المصادر الفلكية، وارتباطه بالكمّيات الفيزيائية مثل نسب الصلابة وكثافات الهيدروجين.

عند إعادة البناء، أظهرت عمليات التجميع في الفضاء الكامن دقة تصنيف متوازنة بلغت حوالي 40% عبر الفئات الثمانية، مما زاد إلى حوالي 69% عند تخصيصه لمصادر AGNs والأجسام النجمية المكثفة فقط. علاوة على ذلك، تتوافق الخصائص الكامنة مع الخصائص الطيفية والزمنية، مما يشير إلى أن التمثيل الذي تم ضغطه يحمل معلومات ذات صلة فيزيائيًّا.

تظهر النتائج أن الميزات المستخرجة مباشرة من طيف الأشعة السينية تعكس المعلومات الفيزيائية بشكل فعّال مثل الميزات التي يستخرجها البشر والتي تتطلب حسابات إضافية. يمكن استخدام هذه الطريقة في التصنيف والانحدار ضمن الدراسات الكبيرة، بالإضافة إلى ارتباطها بالمعلومات الزمنية. كما يمكن تكييف هذه الأساليب مع الكتالوجات الحالية والمستقبلية للأشعة السينية.