في عالم الذكاء الاصطناعي، حيث تلعب نماذج اللغة الكبيرة (Large Language Models) دورًا محوريًا، ظهرت مشكلة بارزة تُعرف بتأثير "فقدان المعلومات وسط النافذة"، حيث تتلقى المعلومات الموجودة في منتصف سياق المدخلات اهتمامًا أقل مقارنة بتلك الموجودة على الحواف. علاوة على ذلك، يتطلب نظام جلب المعلومات التقليدي (Retrieval-Augmented Generation) بنية تحتية معقدة، مما يجعل استرجاع المعرفة مبالغًا فيه في بعض التطبيقات.

تقدم الدراسة الجديدة مفهوم "الاسترجاع الهيكلي الذاتي الوصف" (Self-Describing Structured Retrieval)، والذي يعد بديلاً خفيفًا وفعالًا. يعتمد هذا النهج على إدراج بيانات وصفية أنشأها الإنسان داخل ملفات البيانات الهيكلية، مما يستفيد من ميزة التركيز على المعلومات الموجودة في بداية السياق.

تتضمن هذه الدراسة أيضًا استراتيجية توجيه مزدوجة الطبقات، تجمع بين البيانات الوصفية داخل الملفات وقواعد توجيه واضحة ضمن الإرشادات. تم اختبار هذه الاستراتيجية من خلال مجموعة من التجارب التي أثبتت فعاليتها، حيث حقق النظام نسبة دقة توجيه أولية تصل إلى 100% عند 119 فئة مقارنة بـ 65% في حالة عدم وجود توجيه. يُظهر هذا الابتكار إمكانية كبيرة في تخطي التحديات المتعلقة بتصميم بنية مستودعات المعلومات، مما يفتح آفاق جديدة في مجالات تعتمد على البيانات المتسلسلة.