RS-Claw: ثورة جديدة في استكشاف الأدوات اللغوية لعملاء الاستشعار عن بُعد
مع ظهور نماذج اللغات متعددة الوسائط، تُحدث RS-Claw تحولًا جذريًا في استكشاف الأدوات المستخدمة في الاستشعار عن بُعد من خلال هندسة صغيرة توفر اتساقًا وفعالية أعلى. هذا الابتكار يقود العملاء نحو توليد قرارات أفضل وأسرع.
في عالم الاستشعار عن بُعد، حيث تتغير الأمور بسرعة مع تقدم التكنولوجيا، يأتي RS-Claw كأداة مبتكرة تُعيد صياغة كيفية عمل الوكلاء. مع تزايد تأثير نماذج اللغات متعددة الوسائط (Multi-Modal Large Language Models - MLLMs)، يتحول الذكاء الحقيقي من "الرؤية" إلى "العمل". يعتمد العديد من وكلاء الاستشعار عن بُعد على نموذج انتخابي سكوني لاستخدام الأدوات، إما عبر التسجيل الكامل للأدوات (Flat) أو الجيل المعزز بالاسترجاع (Retrieval-Augmented Generation - RAG). لكن هذا النموذج التقليدي يواجه تحديات في توازن "حمل السياق" و"اكتمال مجموعة الأدوات" خلال عملية التفكير. في هذا السياق، تُظهر الأبحاث أن الأساليب السلبية مثل التسجيل الكامل قد تؤدي إلى انتشار قصور في مساحة السياق أثناء المهام الطويلة، بينما قد يتم التقصير في أدوات حاسمة بأثناء الاسترجاع. لذلك، تقدم الورقة البحثية مفهوم اختيار الأدوات من منظور جديد، حيث تُعتبر الوكلاء مستكشفون نشطون في مجال الأدوات. تعتمد RS-Claw على تقنية تجسيد المهارات (Skill Encapsulation) لإنشاء هيكل هرمي لوصف الأدوات، مما يمكّن الوكيل من اتخاذ قرارات تسلسلية حسب الطلب. بدايةً، يتم اختيار فروع المهارات ذات الصلة من خلال قراءة ملخصات الأدوات، ثم يتم تحميل الوصف التفصيلي بشكل ديناميكي، مما يؤدي إلى استدعاء دقيق. لا يوفر هذا النموذج النشط مجالًا أكبر لنتائج الوكيل فحسب، بل يضمن أيضًا معدلات دقة أعلى في استدعاء الأدوات الحاسمة خلال التفكير الطويل. أظهرت التجارب المنهجية على معيار Earth-Bench أن آلية الاستكشاف النشطة لـ RS-Claw تُفسر الضجيج الدلالي بشكل فعال وتحرر مساحة التفكير بنحو 86%، متفوقةً على النماذج التقليدية مثل Flat وRAG في تقييمات التفكير المعقدة.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
