في السنوات الأخيرة، ألقى التطور السريع لتقنيات النماذج الأساسية (Foundation Models) وتدريب الجرافات (Graph Pre-Training) الضوء على الحاجة الملحة لإنشاء نموذج جرافات عالمي. لكن يواجه الباحثون تحديًا كبيرًا يتمثل في افتقار النماذج الحالية إلى القدرة على معالجة تفاوت الميزات (Feature Heterogeneity) في بيانات الجرافات، خاصة عندما تكون المعلومات النصية غير متاحة، مما يعيق إمكانية نقل نماذج الجرافات عبر مجموعات بيانات مختلفة.

للتغلب على هذا التحدي، نقدم مفهوم "هياكل الجرافات القابلة للتعلم" (Learnable Graph Patches)، التي تُعتبر أصغر وحدات دلالية لأي بيانات جراف. حيث نقوم بتفكيك الجراف إلى هياكل قابلة للتعلم من خلال فتح ميزات العقد (Node Features) وبناء هياكل "patch" ذات صلة. ثم نقوم بتصميم إطار عمل يُستخلص المعلومات القابلة للنقل من بيانات الجراف عبر مجالات مختلفة.

بعد استخراج هياكل الجراف، نقدم "ترميز الهياكل" (Patch Encoder) لاستخراج المعرفة من كل وحدة، و"مجمع الهياكل" (Patch Aggregator) لتعلم كيفية دمج الوحدات في كيان موحد. بفضل طبيعتها غير المعتمدة على المجال، يمكن تطبيق النموذج على البيانات المستقبلية عبر مجالات متعددة.

علاوة على ذلك، نقوم بتحليل الصلة بين طريقتنا ونماذج الجرافات الحالية، فضلاً عن قابلية نقل تمثيلات العقد (Node Embeddings) التي ينتجها. تجريبياً، لا تقتصر طريقتنا على القدرة على استخدام جرافات متعددة المجالات للتدريب المسبق، بل تُظهر أيضاً تحسينات ملموسة في الأداء عبر مجموعات بيانات ومهام متعددة.

وما يُلفت الانتباه هو أن الأداء في المهام النهائية يتحسن بشكل متزايد مع زيادة حجم بيانات التدريب المسبق، مما يؤكد فعالية هذا النموذج الجديد.

ما رأيكم في هذا التطور الملهم؟ شاركونا آرائكم في التعليقات!