في عالم الذكاء الاصطناعي، أصبح من الواضح أن نماذج اللغات الضخمة (Large Language Models) تفتح آفاقاً جديدة في معالجة البيانات، وخاصةً بيانات الاستشعار عن بعد (Remote Sensing). ومع ذلك، فإن فعالية هذه النماذج في المهام المعقدة تعتمد بشكل كبير على مكتبات الأدوات المتخصصة. ولكن تكمن المشكلة الكبيرة في أن توثيق الأدوات غالبًا ما يتجاوز حدود نافذة السياق لنماذج اللغات، مما يجعل الاسترجاع الدقيق للأدوات أمراً ضرورياً لتحسين سير العمل.

يعاني الأسلوب التقليدي لاسترجاع الأدوات من "عائق عدم التوازن الدلالي"، حيث تعبر الاستفسارات اللغوية الطبيعية عن نوايا عامة تفتقر إلى دلالات دقيقة متعلقة بالأدوات، في حين تقدم وثائق الأدوات أوصافاً تقنية مفصلة تفتقر إلى السياق التشغيلي لسير العمل. هنا، تأتي الابتكارات الجديدة لتسد هذه الفجوة.

في هذا السياق، تم تطوير طريقة جديدة ثنائية الاتجاه لاسترجاع الأدوات. تبدأ العملية على جانب الاستفسار من خلال إدخال آلية تعزيز الاستفسار القائمة على التخطيط، حيث يتمكن الوكيل الذكي من تحليل النوايا المجردة إلى مهام منطقية فرعية، مما يثري الاستفسار بالدلالات الوظيفية المفقودة. أما على جانب الأدوات، فقد تم إنشاء رسم بياني ديناميكي يوضح اعتماد الأدوات، مع تكامل قدرات التعلم المستمر. من خلال استخدام آلية تجميع المعلومات من الجيران، يتم حقن المعلومات السياقية للأدوات السابقة داخل تمثيل العقدة الحالية، مما يعزز أوصاف الأدوات بدلالات سياقية.

تشير النتائج التجريبية على مجموعة بيانات GeoPlan-bench ومجموعة بيانات API-Bank العامة إلى أن الطريقة المقترحة لا تعزز دقة استرجاع الأدوات للمهام المعقدة فقط، بل تظهر أيضاً قدراً كبيراً من القابلية للتوسع في تطبيقها على المهام العامة. يمكنكم الوصول إلى الشيفرة المصدرية ومجموعة البيانات من خلال الرابط: https://github.com/geox-lab/BSCTR.

ما رأيكم في هذه التطورات الجديدة في مجال الذكاء الاصطناعي؟ شاركونا آراءكم في التعليقات!