في عالم [استرجاع](/tag/استرجاع) المعلومات، يعد البروتوكول المستخدم في نظام [البحث](/tag/البحث) أمرًا حاسمًا لتحقيق نتائج دقيقة وموثوقة. ولكن، غالباً ما نشهد إخفاقات عند [البحث](/tag/البحث) عن الملفات ذات الصلة بسبب غيابها عن [السياق](/tag/السياق) المسترجع. وواجهت [أنظمة](/tag/أنظمة) الـBM25 التي تعتمد على [تجزئة](/tag/تجزئة) ثابتة (Fixed Generic [Tokenization](/tag/tokenization)) [تحديات](/tag/تحديات) ملحوظة، حيث ما تزال الإخفاقات تلاحق هذا النظام بسبب طبيعة دالة [المعلومات](/tag/المعلومات) المتداخلة.
في [الدراسة](/tag/الدراسة) الأخيرة التي تم طرحها على [منصة](/tag/منصة) arXiv، تم [اقتراح](/tag/اقتراح) حل مبتكر يتمثل في استبدال قاعدة اللوغاريتم الخارجي للـRobertson-Spärck-Jones (RSJ) بتقنية جديدة تُعرف بالـq-log. هذه [التقنية](/tag/التقنية) الجديدة تمكّن من معالجة الفجوات التي قد تظهر في النتائج، حيث أثبتت فعالية ملحوظة في [تحسين](/tag/تحسين) [دقة](/tag/دقة) [استرجاع](/tag/استرجاع) [المعلومات](/tag/المعلومات).
عند تطبيق هذا الأسلوب على [مجموعة بيانات](/tag/مجموعة-[بيانات](/tag/بيانات)) CoIR CodeSearchNet التي تحتوي على 182,000 مستند، ارتفعت نسبة NDCG@10 من 0.2575 إلى 0.4874، مما يعكس زيادة مذهلة بنسبة 89.3% في [الأداء](/tag/الأداء). ومن الجدير بالذكر أن هذه [التقنية](/tag/التقنية) تبين أنها فعالة جدًا، بينما ظل التأثير على [نصوص](/tag/نصوص) BEIR قريبًا من الصفر.
علاوة على ذلك، تبرز [الدراسة](/tag/الدراسة) أن التكلفة المتعلقة بالتصنيف الزمني تبقى ضمن الحدود المعقولة، مما يجعل استخدام هذه [التقنية](/tag/التقنية) في [أنظمة](/tag/أنظمة) [البحث](/tag/البحث) أكثر جاذبية للمطورين.
إذاً، ما هي بالضبط هذه [التقنية](/tag/التقنية) الجديدة وما تأثيرها على عالم [استرجاع](/tag/استرجاع) [المعلومات](/tag/المعلومات)؟ إذا كنت مهتمًا بمستقبل [أنظمة](/tag/أنظمة) البحث، فقد يحتاج هذا [الابتكار](/tag/الابتكار) إلى أن يكون ضمن المهارات الأساسية لكل مطور!
هل أنت مستعد لتجربة هذه [التقنية](/tag/التقنية) الجديدة في [أنظمة](/tag/أنظمة) [البحث](/tag/البحث) لديك؟ شاركنا برأيك في [التعليقات](/tag/التعليقات)!
تحسين استرجاع الكود باستخدام BM25: تقنية جديدة لإصلاح أداء البحث!
تقدم هذه الدراسة تحسينًا في نظام استرجاع الكود BM25، مع استخدام تحويل q-log لحل مشكلات سابقة تؤثر على دقة نتائج البحث. النتيجة: زيادة ملحوظة في دقة استرجاع المعلومات.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
