في عالم الذكاء الاصطناعي، تبقى تساؤلات استرجاع المعلومات من مجموعات البيانات الضخمة تحديًا معرفيًا كبيرًا. هنا يبرز مشروع ليبرا، الذي يعد خطوة ثورية في تدريب البيئات الخاصة بنماذج اللغات الكبيرة (Large Language Models). بينما أثبتت أساليب اعتماد البيانات الاصطناعية نجاحها في تحسين تدريب هذه النماذج، لم يحظَ تحسين بيئات العمل الخاصة بالوكيل (Agent) بالاهتمام الضروري.
يقدم ليبرا إطارًا ذاتي التطور الذي يدمج "كتالوجات" متغيرة تعمل كنقاط فهرسة يمكن التنقل بينها، ما يُسهل عملية استرجاع المعلومات بشكل كبير. يعمل نظام ليبرا من خلال حلقة تحسين مدفوعة بواسطة نماذج لغوية كبيرة، إذ يقوم لاعب الاستعلام (Prompter) بتوليد استفسارات اصطناعية، بينما يحاول الحل (Solver) الثابت التنقل عبر الكتالوجات للوصول إلى الإجابات. إذا كانت هناك إخفاقات في تحديد المواقع، يقوم المعالج (Healer) بإعادة كتابة الكتالوجات لتلافي هذه المشكلات.
تظهر التقييمات التي أُجريت عبر 12 من مستودعات SWE-bench Lite أن هذه التحسينات البيئية تؤدي إلى تحسينات مستمرة في دقة تحديد المواقع الأكواد البرمجية بمعدل لوغاريتمي. الأهم من ذلك، أن هذه التحسينات تنجح في نقل القدرة على تحسين الاسترجاع بين نماذج لغوية كبيرة مختلفة ومجموعات مشاكل متنوعة.
يركز البحث في الأساس على دراسة السلوك العام لمثل هذا النظام. لكن أيضًا، يُظهر أن وكيل البرمجة البسيط المجهز بكتالوجات مُحسّنة من ليبرا يتفوق على البدائل الرائدة في السوق.
يمكنكم الاطلاع على الكود عبر GitHub والبيانات عبر Hugging Face. ما رأيكم في هذا التطور المثير في استرجاع المعلومات؟ شاركونا في التعليقات.
ليبرا: إطار متطور لتحسين استرجاع المعلومات الذكي
يقدم مشروع ليبرا طريقة جديدة لتحسين بيئات استرجاع المعلومات من خلال استخدام كتالوجات متغيرة تُدار بواسطة نماذج لغوية كبيرة (LLM). هذا الابتكار يوفر تحسينات ملحوظة في دقة تحديد المواقع في الأكواد البرمجية.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
