في عصر الرقمية الحديثة، يمثل الويب عالمًا معقدًا ومفتوحًا يتسم بالتغير المستمر، مما يجعل من الصعب جدًا تجميع بيانات التدريب لوكلاء الويب البصرية. وقد عانت المحاولات السابقة في جمع البيانات من محدودية القدرة على الاعتماد على المسارات غير المتصلة بالإنترنت للتدريب الخاضع للإشراف أو مجموعة محدودة من البيئات المحاكية لتدريب التعلم المعزز (Reinforcement Learning).

لذلك، يقدم الباحثون مفهومًا جديدًا يُعرف بـ "ويبليكا" (Weblica)، وهو إطار عمل مصمم لبناء بيئات تدريب قابلة للتكرار وقابلة للتوسع، تمكّن هذه التقنية المنظمات من العمل بكفاءة أعلى.

تستفيد ويبليكا من تقنيتين رئيستين: أولاً، استخدام ذاكرة التخزين المؤقت على مستوى بروتوكول HTTP لالتقاط وإعادة تشغيل الحالات البصرية المستقرة مع الحفاظ على السلوك التفاعلي. وثانيًا، تعتمد على إنشاء بيئات مدعومة بنماذج اللغات الضخمة (Large Language Models) من مواقع الويب الحقيقية ومهارات التنقل الأساسية.

بفضل هذا الإطار، يمكن توسيع نطاق تدريب التعلم المعزز ليشمل آلاف البيئات المتنوعة والمهام المختلفة. النموذج الأفضل، ويبليكا-8B، يتجاوز النماذج ذات الوزن المفتوح المماثلة من حيث الحجم عبر عدة معايير لتقييم التنقل عبر الويب. والأهم من ذلك، أنه يستخدم عددًا أقل من خطوات الاستدلال (Inference Steps) مما يجعل أدائه أكثر كفاءة، حيث يتوسع بشكل إيجابي مع زيادة قدرة الحوسبة في وقت الاختبار، مما يجعله منافسًا قويًا لنماذج واجهة برمجة التطبيقات (API Models).

إن تطور ويبليكا يعد نقلة نوعية في كيفية تدريب وكلاء الويب البصرية، مما يمكّن من تحقيق نتائج أفضل وسرعات أعلى في التعلم. يبدو أن المستقبل ينتظر شيئًا مثيرًا يمكن أن يحدث تغييرًا جذريًا في مجال الذكاء الاصطناعي.

ما رأيكم في هذا التطور؟ شاركونا في التعليقات!