نشهد اليوم نقلة نوعية في مجال الذكاء الاصطناعي، حيث يتجه تطوير عملاء واجهة المستخدم (GUI agents) نحو نماذج أكثر تكاملاً تدعم فهم الصور والنصوص. ومع هذا التقدم السريع، يبقى حل تحديات CAPTCHA من أكبر التحديات التي تواجه هذه التكنولوجيا.

في إطار جهودنا لتطوير حل مبتكر، نقدم لكم ReCAP، وهو وكيل GUI جديد قادر على حل اختبارات CAPTCHA التفاعلية، مع الحفاظ على أدائه المتميز في المهام العامة.

كيف يعمل ReCAP؟ يعتمد النظام الديناميكي لتحديات CAPTCHA المطور حديثًا على سبعة أنواع تمثيلية من CAPTCHA، مما يساعد على استغلال القدرات الأساسية والمعززة لوكلاء GUI.

لكن الأمر لا يتوقف عند هذا الحد، حيث قمنا بتطوير نظام لجمع البيانات بشكل آلي والذي يولد مسارات تفاعل واسعة النطاق مع CAPTCHA، مرتبطة بتتبع العمليات المنطقية. وهذا لأن حل CAPTCHA يتطلب غالبًا تفاعلات متعددة الخطوات وتجاوز الأخطاء الوسطية.

وبالتأكيد، لا تهمل ReCAP تغذية خبراته بالمعلومات من التجارب الفاشلة، حيث تم إدراج بيانات تصحيح ذاتي بهدف تدريب الوكلاء على مراجعة أخطائهم وتصحيح أفعالهم على الفور.

تظهر النتائج الاختبارية، سواء في بيئات تجريبية أو في العالم الحقيقي، أن ReCAP يحقق نجاحًا ملحوظًا في حل تحديات CAPTCHA، متفوقًا بشكل كبير على الوكلاء الأساسيين، بينما يستمر في تأدية مهام وكيل GUI بشكل ممتاز.