في عالم متزايد التعقيد، يحتاج كل من المستخدمين والأنظمة الذكية إلى الانتقال من ردة الفعل إلى الاستباقية. هنا يأتي دور ProActor، الإطار الثوري المقدم في دراسة جديدة، والذي يركز على تعزيز استباقية الوكلاء المعتمدين على المهام. يعتمد ProActor على منهجية تلقائية لتوسيم البيانات، مما يسمح بالتحسين القابل للتوسع عن طريق التعلم المعزز (Reinforcement Learning) من خلال تحديد نوافذ زمنية كاملة للفرص بدلاً من علامات ثابتة. \n\nتقدم الدراسة مقياسًا منظمًا للاستمراكية، يلتقط جودة التوقيت وتوافق الإجراءات المرجعية، مما يمهد الطريق لمزيد من التحسينات في جودة التوقيت من خلال المكافآت المعتمدة على RULER. كما أن اعتماد مراحل معينة للمكافآت composite يعزز من القدرة على التوازن بين الجودة والتوافق. \n\nتتميز مقاربة ProActor بالبحث العميق، إذ يستدعي استفادة فعالة من البنية التحتية من خلال تطوير ART-F، إطار تكيفي يمزج بين مجموعات الاستدلال المتكيفة وتدريب مبني على DDP في أنظمة متعددة وحدات معالجة الرسوم (Multi-GPU). \n\nأثبتت التجارب على مجموعتي بيانات تم وضعها تلقائيًا تحسنًا كبيرًا في توقيت الاستباقية، مع الحفاظ على استمرارية الإجراءات بشكل مماثل لأفضل النماذج الحالية. إن هذه الابتكارات تمثل بداية جديدة لوكلاء المهام القادرين على التنبؤ الفعال باحتياجات المستخدمين.