في عالم الذكاء الاصطناعي، يعتقد الكثيرون أن الوكلاء (agents) يجب عليهم دائمًا التصرف لتحقيق الأهداف. ولكن ماذا عن الأهداف التي لا يمكن تحقيقها بسبب ظروف معينة أو عدم وضوح الأهداف؟ هنا يأتي دور مفهوم "التوقف الوكالي" (Agentic Abstention)، وهو فكرة مبتكرة تجعل الوكلاء يتخذون قرارات أكثر ذكاءً في أوقات عدم اليقين.
يتمثل دور الوكلاء الذكاء الاصطناعي في تنفيذ المهام على مدى عدة خطوات، حيث يستخدمون بحثًا، وواجهات تصفح، وأدوات طرفية لتحقيق أهداف المستخدمين. لكن ليس كل هدف محدد بشكل جيد أو يمكن تحقيقه في البيئة المتاحة. لذلك، يحتاج الوكيل الموثوق إلى التعرف على متى تكون التفاعلات الإضافية غير مجدية والامتناع عن كل استدعاء للأدوات.
قمنا بدراسة هذه المشكلة عبر مجموعة من السيناريوهات، بما في ذلك التسوق عبر الإنترنت، والبيئات الطرفية، والإجابة على الأسئلة، حيث تم تقييم 13 نموذجًا من نماذج الوكيل و 2 من الدعائم الوكيلة عبر أكثر من 28,000 مهمة. أظهرت النتائج أن التحدي الرئيسي ليس فقط في قدرة الوكلاء على الامتناع، بل أيضًا في توقيت هذا الامتناع. فبعض الوكلاء لا يمتنعون أبدًا عندما يجب عليهم ذلك، بينما يمتنع آخرون بعد سلسلة من التفاعلات غير الضرورية.
نجد أيضًا أن حجم النموذج (model scale) والتفكير (reasoning) والدعائم الوكيلة (agent scaffolding) تؤثر على الامتناع بطرق مختلفة. في حين أن النماذج الأكبر أو الأكثر قابلية قد تؤدي في بعض الأحيان بشكل أسوأ في اتخاذ قرارات الامتناع الملائمة، عرضنا أيضًا طريقة جديدة تُعرف بـ"CONVOLVE"، والتي تهدف إلى تحسين التوقف الوكالي من خلال استخلاص مسارات التفاعل الكاملة إلى قواعد توقف قابلة لإعادة الاستخدام. على سبيل المثال، في بيئة التسوق عبر الإنترنت، نجح تطبيق CONVOLVE في رفع معدل الاسترجاع الملائم لنموذج Llama-3.3-70B من 26.7% إلى 57.4% دون الحاجة لتحديث معلمات النموذج.
هذا البحث يفتح آفاقاً جديدة في فهم كيفية تصرف الوكلاء الذكاء الاصطناعي تحت ظروف عدم اليقين، مما يمكّنهم من تقديم أداء أكثر كفاءة وأكثر ذكاءً. ما رأيكم في هذه التطورات؟ شاركونا آرائكم في التعليقات!
قرارات فعلية: كيف يعرف الوكلاء متى يتوقفون عن التصرف؟
تقديم مفهوم جديد يُعرف بـ"التوقف الوكالي" حيث يتعلم الوكلاء الذكاء الاصطناعي متى يتعين عليهم الامتناع عن التفاعل. هذه الرؤية تعزز من قدرة الأنظمة على اتخاذ قرارات أفضل في ظروف عدم اليقين.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
