في عالم الذكاء الاصطناعي، تبقى تساؤلات استرجاع المعلومات من مجموعات البيانات الضخمة تحديًا معرفيًا كبيرًا. هنا يبرز مشروع ليبرا، الذي يعد خطوة ثورية في تدريب البيئات الخاصة بنماذج اللغات الكبيرة (Large Language Models). بينما أثبتت أساليب اعتماد البيانات الاصطناعية نجاحها في تحسين تدريب هذه النماذج، لم يحظَ تحسين بيئات العمل الخاصة بالوكيل (Agent) بالاهتمام الضروري.

يقدم ليبرا إطارًا ذاتي التطور الذي يدمج "كتالوجات" متغيرة تعمل كنقاط فهرسة يمكن التنقل بينها، ما يُسهل عملية استرجاع المعلومات بشكل كبير. يعمل نظام ليبرا من خلال حلقة تحسين مدفوعة بواسطة نماذج لغوية كبيرة، إذ يقوم لاعب الاستعلام (Prompter) بتوليد استفسارات اصطناعية، بينما يحاول الحل (Solver) الثابت التنقل عبر الكتالوجات للوصول إلى الإجابات. إذا كانت هناك إخفاقات في تحديد المواقع، يقوم المعالج (Healer) بإعادة كتابة الكتالوجات لتلافي هذه المشكلات.

تظهر التقييمات التي أُجريت عبر 12 من مستودعات SWE-bench Lite أن هذه التحسينات البيئية تؤدي إلى تحسينات مستمرة في دقة تحديد المواقع الأكواد البرمجية بمعدل لوغاريتمي. الأهم من ذلك، أن هذه التحسينات تنجح في نقل القدرة على تحسين الاسترجاع بين نماذج لغوية كبيرة مختلفة ومجموعات مشاكل متنوعة.

يركز البحث في الأساس على دراسة السلوك العام لمثل هذا النظام. لكن أيضًا، يُظهر أن وكيل البرمجة البسيط المجهز بكتالوجات مُحسّنة من ليبرا يتفوق على البدائل الرائدة في السوق.

يمكنكم الاطلاع على الكود عبر GitHub والبيانات عبر Hugging Face. ما رأيكم في هذا التطور المثير في استرجاع المعلومات؟ شاركونا في التعليقات.