تتسارع وتيرة التطورات في مجال الذكاء الاصطناعي، وبخاصة في عملية استرجاع البيانات الكبيرة على نطاق واسع. إذ يعتمد الأداء الجيد في البحث عن أقرب جيران (Approximate Nearest Neighbour - ANN) على تقنيات مبتكرة تساهم في تحسين فعالية نماذج استرجاع النصوص. ولكن على الرغم من هذا التقدم، يبدو أن طرق البحث تتنوع إلى حد كبير عبر مختلف المجالات، مما يجعل من الصعب قراءتها كحقل موحد.

نحن نرى أن هذه الطرق تتجمع في إطار واحد، يعتمد على ثلاثة خيارات تصميم رئيسية. من هنا، تم تطوير منظور الإسقاط – الكوانتيزاتيون – التنظيم (Projection-Quantisation-Organisation - PQO) والذي يدمج تقنيات مختلفة مثل التجزئة الحساسة للموقع (Locality-Sensitive Hashing)، والتجزئة الثنائية المتعلمة (Learned Binary Hashing)، وأيضًا التجزئة المتكاملة عن طريق العمق (Deep End-to-End Hashing).

الأهم من ذلك، يكشف هذا الإطار كيف يتم توصيل الأسئلة الثلاثة: أين يتم وضع الإسقاطات، أين يتم وضع حدود الكوانتيزاتيون، وكيف يتم تنظيم الرموز الناتجة. أحد الاكتشافات الهامة هو أن الذاكرة يمكن اختصارها بشكل ملحوظ على محور الكوانتيزاتيون، حيث يمكن أن يمثل رمز بقدرة بت واحدة ثلثين الحجم المقابل للقيم العائمة.

علاوة على ذلك، تشير القياسات التي تم الحصول عليها إلى أن استخدام رمز بثمانية بايت يمكن أن يزيد من جودة النتائج بشكل أكبر من ضعف الجودة التي يوفرها رمز بحجم كيلوبايتين. وبهذا، فإننا نطلق هذه القياسات كمرجع قابل للتطوير يعرف باسم "BitBudget"، ويضم قائمة نتائج حية.

إن إعادة تصور الاسترجاع المعزز الناجم عن هذا البحث يعد بتقديم حلول فعالة لمشكلات مفتوحة، ويعيد تركيز النقاش حول الرموز المدمجة كعنصر محوري في استرجاع البيانات. هل أنتم مستعدون لاستكشاف مستقبل تقنيات الذكاء الاصطناعي؟ شاركونا آراءكم في التعليقات.