في ظل التقدم سريع الخطى في [نماذج [اللغات](/tag/اللغات) الضخمة](/tag/[نماذج](/tag/نماذج)-[اللغات](/tag/اللغات)-الضخمة) (Large Language [Models](/tag/models))، تواجه [أنظمة](/tag/أنظمة) [البحث](/tag/البحث) عن [المعلومات](/tag/المعلومات) [تحديات](/tag/تحديات) كبيرة في [تخزين](/tag/تخزين) ومعالجة التضمينات ذات الأبعاد العالية. ومع ظهور [تقنيات جديدة](/tag/[تقنيات](/tag/تقنيات)-جديدة) مثل Matryoshka-Adaptor وSearch-Adaptor، كانت الحاجة ملحة لإيجاد [حلول](/tag/حلول) أكثر [كفاءة](/tag/كفاءة). هنا تظهر [تقنية](/tag/تقنية) DIVE، التي تمثل اختصارًا لـ(ديمensionality reduction with Implicit View Ensembles).
[DIVE](/tag/dive) لا تُعزز فقط من القدرة على [ضغط التضمينات](/tag/ضغط-التضمينات) بل تعتمد أيضًا على [استراتيجيات](/tag/استراتيجيات) فعالة للحد من الإفراط في [التعلم](/tag/التعلم) (Overfitting)، والتي غالبًا ما تُواجه في [البيانات](/tag/البيانات) المحدودة. كيف تعمل هذه [التقنية](/tag/التقنية) الجديدة؟
تسعى [DIVE](/tag/dive) لتحقيق [ضغط التضمينات](/tag/ضغط-التضمينات) من خلال آليتين رئيسيتين. الأولى هي وظيفة خسارة ثلاثية تعتمد على الحواف (hinge-based triplet loss) والتي تحد من الزيادة في التعديلات على [الفضاء](/tag/الفضاء) المسبق للتمثيلات، مما يسمح بتحقيق [دقة](/tag/دقة) عالية حتى عند استخدام [مجموعات بيانات](/tag/مجموعات-[بيانات](/tag/بيانات)) صغيرة. أما الآلية الثانية، فهي تعتمد على خسارة NT-Xent التباينية الرأسية (head-wise NT-Xent contrastive loss)، التي تُقارب عدة إسقاطات تم تعلمها لكل تضمين كوجهات نظر ضمنية. هذه الاستراتيجية توفر تدرجات [تعليم](/tag/تعليم) ذاتية كثيفة تُعوض عن ندرة الإشارات في [مجموعات البيانات](/tag/مجموعات-[البيانات](/tag/البيانات)) الصغيرة.
أظهرت [التجارب](/tag/التجارب) [عبر](/tag/عبر) ست [مجموعات بيانات](/tag/مجموعات-[بيانات](/tag/بيانات)) BEIR أن [DIVE](/tag/dive) تتفوق بشكل ملحوظ على الثلاثي التقليدي، مما يجعلها الخيار المثالي لتحسين [أداء](/tag/أداء) [أنظمة](/tag/أنظمة) [البحث](/tag/البحث).
بفضل تنفيذها [مفتوح المصدر](/tag/مفتوح-المصدر) الذي يحتوي على 14 مليون معلمة، فإن [DIVE](/tag/dive) ليست مجرد [تقنية](/tag/تقنية) مبتكرة، بل تمثل أيضًا خطوة كبيرة [نحو](/tag/نحو) [تحسين الذكاء الاصطناعي](/tag/[تحسين](/tag/تحسين)-الذكاء-الاصطناعي) في مجالات [البحث](/tag/البحث) واسترجاع [المعلومات](/tag/المعلومات).
ما رأيكم في هذه [التقنية](/tag/التقنية)؟ كيف يمكن أن تؤثر على [مستقبل](/tag/مستقبل) [البحث](/tag/البحث) عن [المعلومات](/tag/المعلومات)؟ شاركونا آراءكم في [التعليقات](/tag/التعليقات)!
DIVE: ثورة جديدة في ضغط التضمينات باستخدام تحديثات ذاتية محددة!
تقدم DIVE طريقة مبتكرة لضغط التضمينات عالية الأبعاد، مما يقلل بشكل كبير من التكاليف التخزينية والحسابية. اكتشف كيف يمكن لهذه التقنية أن تحسن أداء أنظمة البحث عن المعلومات.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
