في خطوة جديدة نحو تفعيل دور وكلاء الذكاء الاصطناعي على الويب، تم تقديم نظام GTA الذي يعد تطورًا مذهلاً في كيفية إنشاء مهام معقدة ومتعددة المراحل. يتمتع هذا النظام بالقدرة على دمج نماذج اللغة (Language Models) مع تقنيات تصفح الإنترنت واستخدام الأدوات، مما يجعله مساعدًا قويًا على الويب المفتوح.
على الرغم من الوعود الكبيرة لوكلاء الويب، إلا أن تقدم هذا المجال كان محدودًا بسبب نقص الإشراف القابل للتوسع. فالتقييمات الحالية تعتمد على بناء يدوي، مما يعني أنها توفر ملاحظات فنية متوسطة فقط دون توفير مسارات متوسطة ضرورية لفهم الأداء. بينما كانت جهود التوليد التلقائي السابقة مكلفة وذات انحياز، مما جعلها غير موثوقة في تدريب وتقييم الوكلاء.
جاءت GTA لتغيير هذا الواقع، حيث تقدم إطار عمل شامل يدمج الزحف (Crawling) والتوليد في السياق (In-Context Generation) والتحقق من الجودة بشكل تلقائي، لإنتاج مهام واقعية تر acompañanها مسارات قابلة للتنفيذ. هذا التصميم يفصل بين الزحف والتوليد لتحقيق كفاءة أكبر، كما يؤسس المهام على الرسم البياني للموقع لضمان التكوين الصحيح، ويحقق إشرافًا كثيفًا من خلال الإعادة الحتمية والتحقق المنهجي.
يتم تطبيق هذه التقنية الحديثة على أكثر من 50 موقعًا متنوعًا تشمل التجارة الإلكترونية، والحكومة، والمنتديات، والأخبار، مع تغطية متعددة اللغات والمهام. وكشف هذا النظام الجديد عن فجوة أداء هائلة بين الإنسان والوكيل، مما يتيح تشخيصًا دقيقًا وتفصيليًا.
تتضمن مساهمات GTA ثلاثة محاور رئيسية: (i) صياغة توليد المهام لوكلاء الويب متعددة المراحل، (ii) اقتراح خط أنابيب فعال وموثق لإنشاء البيانات تلقائيًا، (iii) إصدار معيار ديناميكي مع تقييم قابل للتكرار.
ثورة جديدة في الذكاء الاصطناعي: إنشاء مهام معقدة لوكلاء الويب أضعاف ما كان متوقعًا!
تقدم GTA إطار عمل قادر على إنشاء مهام معقدة لوكلاء الويب، مما يعزز قدرتهم على الأداء في مهام متعددة ومتنوعة. هذه التقنية تمثل بداية عصر جديد في تطوير وكلاء الذكاء الاصطناعي.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
