تشهد تقنيات استرجاع المعلومات تطورًا ملحوظًا، وخاصة مع التقدم الملحوظ في الأنظمة غير المراقبة (Unsupervised Retrievers) التي تعتمد على التعلم التبايني (Contrastive Learning) لفهم العلاقات الدلالية بين الوثائق غير المعلّمة. ومع ذلك، يعاني معظم هذه الأنظمة من تحدٍ كبير يتمثل في صعوبة التقاط الصلة الزمنية، حيث تسترجع وثائق ذات صلة دلاليًا ولكن غير متوافقة زمنيًا، مما يؤدي إلى غموض في النتائج، خاصةً عندما تتضمن مجموعة الوثائق تواريخ متباينة.

لحل هذه المشكلة، تم اقتراح تقنية جديدة تُعرف باسم TPOUR (تحسين التفضيلات الزمنية لاسترجاع المعلومات غير المراقب)، والتي تعتمد على طريقة تدريب مبتكرة تُعرف باسم TRPO (تحسين تفضيلات الاسترجاع الزمنية). تعمل TRPO على إعادة تفسير تعلم التفضيلات للأبعاد الزمنية، مما يُمكّن نظام الاسترجاع من تفضيل الوثائق المتوافقة زمنياً.

كما أن TPOUR تتوسع بشكل عام لتشمل فترات زمنية جديدة غير مسبوقة من خلال عمليات الاستيفاء في تضمين الزمن الذي تم تعلمه، مما يُوفر توافقًا زمنيًا مستمرًا.

أظهرت التجارب التي تم إجراؤها في مجال استرجاع المعلومات الزمنية (T-IR) أن TPOUR تتفوق على المعايير غير المراقبة والمراقبة التقليدية. ورغم أن TPOUR Contriever أقل حجمًا بما يقارب 72.7 مرة مقارنةً بـ Qwen-Embedding-8B، إلا أنها حسّنت متوسط النسبة المئوية للنقاط العالمية (nDCG@5) بنسبة +4.04% (+12.15%) على الاستفسارات الصريحة و+4.98% (+15.21%) على الاستفسارات الضمنية.

للمزيد من التفاصيل حول هذه التقنية الجديدة، يمكنكم العثور على الكود المصدري على github. هذا الإنجاز يمثل خطوة مهمة نحو تحسين القدرات الحالية لنظم الذكاء الاصطناعي في مجال استرجاع المعلومات.

ما رأيكم في هذا التطور؟ شاركونا في التعليقات.