في عالم البيانات الضخمة، يُعد الاسترجاع القائم على الرسوم البيانية (Graph-based retrieval) بمليارات العقد تحديًا حقيقيًا يتطلب معالجة ثلاث مشاكل مترابطة بشكل وثيق. إذ يتمثل هذا التحدي في كيفية بناء الرسم البياني، وتعلم التمثيل، وتقديم الخدمة في الوقت الحقيقي.

اليوم، نقدم لكم "رانكغرف-2" (RankGraph-2)، وهو إطار مبتكر تم تطويره في شركة ميتا (Meta) الذي يجمع بين هذه المراحل الثلاث بذكاء لتسهيل الوصول إلى المعلومات بطريقة أكثر كفاءة. يقوم الإطار بتصميم دورة حياة الاسترجاع القائم على التشابه (Similarity-based retrieval) بحيث تتشكل متطلبات كل مرحلة من المراحل الأخرى.

أحد أبرز ميزات رانكغرف-2 هو استخدام فهرس عناقيد تم تعلمه بشكل مشترك لتجنب تكلفة معالجة الجيران الأقرب (KNN) على الإنترنت، مما يعزز الهدف التدريبي. من خلال الاستفادة من خاصية استرداد المعلومات القائمة على التشابه، يتمكن الإطار من الاستغناء عن بنية الرسم البياني على الإنترنت، حيث يتعين أن تنتج عملية البناء بيانات شاملة.

علاوة على ذلك، يدعم رانكغرف-2 تحديثات سريعة لرصد العناصر كل ساعة. ومن خلال معالجة هذه المتطلبات المتسلسلة، تم تقليص عدد الحواف من مئات التريليونات إلى مئات المليارات عبر عملية أخذ العينات مع تصحيح تحيز الشعبية، كما يحسب الجيران في الطلعات المتعددة عبر خوارزمية PageRank مخصصة، ويتعلم معًا فهرس عناقيد يتضمن تقليل التكلفة التشغيلية بنسبة تصل إلى 83%.

يتميز هذا التصميم التكاملي بتقديم بنية بسيطة تحقق نسبة تذكر أعلى بـ 3.8 مرة مقارنة بنموذج GAT + Deep Graph Infomax على رسم بياني ثنائي الاتجاه، و2.1 مرة أعلى من PyTorch-BigGraph في استرجاع العناصر. رانكغرف-2 قدّم تحسينات تصل إلى +0.96% في معدل النقر (CTR) و+2.75% في معدل التحويل (CVR)، وقام بتمكين أكثر من 20 إطلاق لعمليات الاسترجاع عبر المنصات الرئيسية.

في ختام هذا المقال، لا يمكننا إلا أن نتساءل: كيف سيساهم رانكغرف-2 في تحسين تجارب المستخدمين في المستقبل؟ شاركونا أفكاركم في التعليقات!