في عالم الذكاء الاصطناعي، تمثل نماذج استرجاع المعلومات الكثيفة (Dense Retrieval Models) جزءًا أساسيًا من عمليات البحث وتحليل البيانات. ولكن، هناك تحدٍ كبير يتمثل في وجود تحيز مكاني (Positional Bias) يؤثر سلبًا على فعالية الاسترجاع، حيث تقل قدرة النموذج على استرجاع المعلومات ذات الصلة عندما تظهر في مواقع متأخرة ضمن النص. في دراسة جديدة نشرت على منصة arXiv، قام الباحثون بالتساؤل عما إذا كان بإمكانهم تقليل هذا التحيز خلال مرحلة استنتاج المعلومات، دون الحاجة إلى إعادة تدريب النموذج ودون المساس بفاعلية الاسترجاع العامة.
اعتمدت الدراسة على تقنية جديدة تعرف باسم معايرة الانتباه أثناء الاستنتاج (Inference-time Attention Calibration)، التي تم توسيعها بإضافة معامل قوة (Strength Coefficient) يُطلق عليه اسم “لامدا” (λ) والذي يتحكم في توازن توزيع الأنظار بين التوزيع الأصلي والمعاير بالكامل.
أظهرت النتائج التي تم الحصول عليها عبر ثلاثة نماذج للتمثيل باستخدام مجموعات بيانات مثل SQuAD-PosQ وFineWeb-PosQ أنه يمكن تحقيق توازن فعال بين العدالة المكانية وفاعلية الاسترجاع. على الرغم من أن المعايرة الجزئية كثيرًا ما تتفوق على المعايرة الكاملة، لكن توصل الباحثون إلى إعداد وحيد (B=128، λ=0.5، عمق طبقة 50%) يحسن من المتوسط التوافقي (Harmonic Mean) لمؤشر nDCG@10 عبر مجموعات مختلفة من البيانات.
المثير في الأمر هو أن هذا الإعداد القياسي يمكن تطبيقه بغير تعديل على نظام PosIR، الذي يدعم 10 لغات و31 مجالًا، مما يقلل من مؤشر حساسيات المواقع عبر جميع التركيبات الممكنة، مع الحفاظ على أو تحسين تأثير الاسترجاع الكلي.
بالإضافة إلى ذلك، يقوم الباحثون بإتاحة مجموعة الأكواد الموسعة الخاصة بهم على GitHub لكي يتمكن المجتمع من الاستفادة منها وبدء تجارب جديدة، ويمكن الوصول إليها على الرابط GitHub. كيف يمكن لرؤية هذه التقنية الجديدة أن تُحدث فرقًا في مستقبل استرجاع المعلومات في الذكاء الاصطناعي؟ شاركونا آرائكم في التعليقات!
تقنية جديدة لتقليل التحيز المكاني في استرجاع المعلومات الكثيف!
تتناول دراسة حديثة كيفية تقليل التحيز المكاني في نماذج استرجاع المعلومات الكثيفة دون الحاجة لإعادة التدريب. النتائج تظهر فاعلية جديدة في تحسين أداء الاسترجاع عبر عدة نماذج ومجموعات بيانات متعددة.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
