تتقدم تكنولوجيا الذكاء الاصطناعي (AI) بسرعة، ومع استخدامها المتزايد في إنجاز المهام الحاسوبية اليومية، تستمر الأسئلة حول كفاءتها وفعاليتها في الظهور. في دراسة حديثة، تم فحص الأداء الزمني للوكلاء الذكيين باستخدام معيار OSWorld، وهو معيار بارز في مجال الذكاء الاصطناعي في الاستخدامات المكتبية.

تشير النتائج إلى أن نماذج الذكاء الاصطناعي الحالية تركز بشكل رئيسي على تحسين الدقة على المعايير المعروفة، ولكن المشكلة الكبرى تكمن في زمن الاستجابة. إذ تعاني الأنظمة الحديثة من فترات تأخير طويلة للغاية، تصل في بعض الحالات إلى عشرات الدقائق لأداء مهام يمكن أن يتم إنجازها من قبل البشر في دقائق قليلة.

توضح الدراسة أن استدعاءات النماذج الكبيرة (Large Model Calls) التي تستخدم في التخطيط والتفكير والحكم تمثل غالبية فترة التأخير الإجمالية. ومن المثير للاهتمام، أنه مع زيادة عدد الخطوات التي يتخذها الوكيل لإكمال مهمة ما، يمكن أن تستغرق كل خطوة تالية أكثر بثلاث مرات من الخطوات الأولى.

للتغلب على هذه المشكلة، تم تطوير OSWorld Human، وهو إصدار تم التعليق عليه يدويًا من مجموعة بيانات OSWorld الأصلية، حيث يحتوي على مسار محدد بشري لكل مهمة. وقد تم تقييم 16 وكيلًا بناءً على كفاءتهم باستخدام OSWorld Human، لتظهر النتائج أن أفضل هؤلاء الوكلاء يستخدمون 2.7 إلى 4.3 مرة أكثر من الخطوات اللازمة لإنجاز المهام.

هذا البحث لا يسلط الضوء فقط على التحديات الحالية للوكلاء الذكيين، بل يفتح أيضًا أفقًا جديدًا لتحسين تصميمها في المستقبل. ما رأيكم في هذا التطور؟ شاركونا في التعليقات.