تتقدم [تكنولوجيا الذكاء الاصطناعي](/tag/[تكنولوجيا](/tag/تكنولوجيا)-الذكاء-الاصطناعي) ([AI](/tag/ai)) بسرعة، ومع استخدامها المتزايد في إنجاز المهام الحاسوبية اليومية، تستمر الأسئلة حول كفاءتها وفعاليتها في الظهور. في [دراسة](/tag/دراسة) حديثة، تم [فحص](/tag/فحص) [الأداء](/tag/الأداء) الزمني للوكلاء الذكيين باستخدام معيار OSWorld، وهو معيار بارز في مجال [الذكاء الاصطناعي](/tag/الذكاء-الاصطناعي) في الاستخدامات المكتبية.

تشير النتائج إلى أن [نماذج الذكاء الاصطناعي](/tag/[نماذج](/tag/نماذج)-الذكاء-الاصطناعي) الحالية تركز بشكل رئيسي على [تحسين الدقة](/tag/[تحسين](/tag/تحسين)-[الدقة](/tag/الدقة)) على [المعايير](/tag/المعايير) المعروفة، ولكن المشكلة الكبرى تكمن في زمن الاستجابة. إذ تعاني الأنظمة الحديثة من فترات تأخير طويلة للغاية، تصل في بعض الحالات إلى عشرات الدقائق لأداء مهام يمكن أن يتم إنجازها من قبل البشر في دقائق قليلة.

توضح [الدراسة](/tag/الدراسة) أن استدعاءات [النماذج الكبيرة](/tag/[النماذج](/tag/النماذج)-الكبيرة) (Large [Model](/tag/model) Calls) التي تستخدم في [التخطيط](/tag/التخطيط) والتفكير والحكم تمثل غالبية فترة التأخير الإجمالية. ومن المثير للاهتمام، أنه مع زيادة [عدد](/tag/عدد) الخطوات التي يتخذها الوكيل لإكمال مهمة ما، يمكن أن تستغرق كل خطوة تالية أكثر بثلاث مرات من الخطوات الأولى.

للتغلب على هذه المشكلة، تم [تطوير](/tag/تطوير) OSWorld Human، وهو إصدار تم التعليق عليه يدويًا من [مجموعة بيانات](/tag/مجموعة-[بيانات](/tag/بيانات)) OSWorld الأصلية، حيث يحتوي على مسار محدد بشري لكل مهمة. وقد تم [تقييم](/tag/تقييم) 16 وكيلًا بناءً على كفاءتهم باستخدام OSWorld Human، لتظهر النتائج أن أفضل هؤلاء [الوكلاء](/tag/الوكلاء) يستخدمون 2.7 إلى 4.3 مرة أكثر من الخطوات اللازمة لإنجاز المهام.

هذا [البحث](/tag/البحث) لا يسلط الضوء فقط على التحديات الحالية للوكلاء الذكيين، بل يفتح أيضًا أفقًا جديدًا لتحسين تصميمها في المستقبل. ما رأيكم في هذا التطور؟ شاركونا في [التعليقات](/tag/التعليقات).