في عالم الذكاء الاصطناعي، يعتبر تحسين أداء الوكلاء الحاسوبيين (Computer-Use Agents) أحد الأهداف الأساسية لتحقيق تجربة مستخدم أفضل. اليوم، نود تسليط الضوء على ابتكار جديد يُعرف باسم IntentScore، وهو نموذج مكافأة يعتمد على النية (Intent) يقوم بتقييم الأفعال التي تقوم بها الوكلاء الحاسوبيين في بيئات واجهات الاستخدام الرسومية (GUI).
تواجه الوكلاء الحاسوبيون تحديًا كبيرًا، حيث يقومون بتنفيذ الأفعال دون تقييم جودة تلك الأفعال، مما يتسبب في أخطاء قد تستمر وتتراكم في خطوات الاستخدام اللاحقة. هنا يأتي دور IntentScore، الذي تم تطويره لتفادي هذه المشكلات من خلال تعلم تقييم الأفعال المرشحة بناءً على 398,000 خطوة تفاعل سابقة عبر ثلاث أنظمة تشغيل مختلفة.
تعتمد تقنية IntentScore على هدفين متكاملين: الأول هو التوافق التبايني (contrastive alignment) لأهمية الحالة-الفعل، والثاني هو تصنيف الفعل من حيث صحته (margin ranking). هذه الطريقة تمنح النموذج القدرة على التمييز بين الأفعال المتشابهة من حيث التنفيذ ولكن مختلفة في النية.
نجح IntentScore في تحقيق دقة تصل إلى 97.5% في التمييز بين الأفعال أثناء تقييمه. عند تطبيقه كنموذج منقح لوكيل S3 في بيئة OSWorld، التي لم يتم تدريب النموذج عليها مسبقًا، أسهم في تحسين معدل نجاح المهام بمعدل 6.9 نقطة.
إن هذا يثبت أن تقدير المكافأة المستند إلى مسارات تفاعل غير متجانسة يمكن أن يتكيف مع وكلاء ومهام جديدة، مما يدل على الإمكانات الهائلة التي يحملها الذكاء الاصطناعي في تعزيز تجربة المستخدم. كيف تجدون هذا الابتكار؟ هل تعتقدون rằng تقنيات مثل IntentScore ستغير مستقبل التعامل مع البرامج؟ شاركونا آراءكم في التعليقات!
اكتشف كيف يمكن لـ IntentScore تحسين أداء الوكلاء الحاسوبيين بشكل ثوري!
تمكن الباحثون من تقديم تقنية جديدة تُدعى IntentScore، التي تسهم في تقييم جودة الأفعال التي تنفذها الوكلاء الحاسوبيون، مما يقلل من الأخطاء. هذه التقنية تعتمد على التعلم من تفاعلات سابقة لتحقيق أداء أعلى.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
