في عالم الذكاء الاصطناعي، يعتمد نجاح عوامل الويب (Web Agents) على كيفية فهمها للصفحات الإلكترونية من خلال ما يُعرف بمساحة المراقبة. ومع ذلك، يبدو أن تفاصيل هذه المساحة لم تحظَ بما يكفي من الدراسة، حيث اعتُمدت الأساليب التقليدية على مستويات العناصر الفردية في المراقبة، تاركةً التنظيم الوظيفي للصفحة كمعطى ضمني. في هذا السياق، تقدم الورقة البحثية الجديدة إطارًا مبتكرًا يُدعى 'Region4Web'، الذي يعيد التفكير بشكل جذري في كيفية تجميع عناصر الصفحات إلى مناطق وظيفية، حيث يُفترض أن كل منطقة تخدم غرضًا محددًا.
يقوم 'Region4Web' بإعادة تنظيم الشجرة الهيكلية للصفحة (AXTree) من خلال التفكيك الهرمي والتجريد الدلالي، مما يُبرز التنظيم الوظيفي للصفحات كأساس لفهم الحالة العامة للصفحة. بالإضافة إلى ذلك، تم تقديم تقنية جديدة تُدعى 'PageDigest'، وهي عملية استنتاج مخصصة للويب تقوم بتوفير هذا المراقبة على مستوى المناطق إلى عوامل الفاعل (Actor Agent) بشكل مختصر وذو صلة، مما يعزز القدرة على إتمام المهام بفاعلية أكبر.
وفقًا للاختبارات التي أُجريت على معيار 'WebArena'، أثبتت 'PageDigest' قدرتها على تقليل طول المراقبة بشكل كبير، مع تحسين معدل النجاح في إنجاز المهام عبر نماذج لغوية ضخمة (Large Language Models) وأساليب عوامل معروفة، دون النظر إلى سعة الهيكل الخلفي. تبرز هذه النتائج أهمية التحول في المراقبة نحو المناطق الوظيفية في تعزيز الفهم وتقليل التعقيد في معالجة المعلومات.
منطقة الويب: إعادة تفكير في تفاصيل المراقبة لعوامل الويب
تقدم الدراسة إطارًا جديدًا يعرف باسم 'Region4Web' يهدف إلى تحسين تصميم المراقبة لعوامل الويب من خلال تقسيم الصفحات إلى مناطق وظيفية. يساعد هذا الأسلوب في تعزيز فهم الصفحات وتحقيق نجاح أعلى في المهام.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
