في عالم الذكاء الاصطناعي، تحتاج الأنظمة المتطورة إلى أكثر من مجرد نماذج قوية. هذا ما أكده بحث حديث أشار إلى ضرورة توسيع الأنظمة (System Scaling)، وليس فقط النماذج (Model Scaling). الفكرة الرئيسية هنا هي تصميم هياكل موثوقة، قابلة للتدقيق، وحديثة، تأخذ في الاعتبار التعامل مع نماذج الأساس (Foundation Models) كعنصر رئيسي في التصميم والتقييم والتحسين.

على الرغم من أن النماذج اللغوية الكبيرة (Large Language Models) قد مكنت الوكلاء من استخدام الأدوات، واسترجاع المعلومات، وصيانة الذاكرة، وتنفيذ مهام طويلة الأمد، إلا أن التقييم لا يزال يركز بشكل كبير على النجاح في المهام النهائية، مما يقلل من أهمية الجوانب الأخرى مثل الذاكرة، والاسترجاع، واستخدام الأدوات.

لكن الأداء الفعلي للوكلاء الذكيين ينبع من تفاعل عدة عناصر، بما في ذلك نموذج الأساس، وطبقة الذاكرة، وبناء السياق، وطبقة توجيه المهارات، وآلية التنفيذ، وطبقة التحقق والحوكمة. هذه المكونات تشكل معاً ما يُعرف بـ "حزمة الوكلاء" (Agent Harness)، التي تنقل قدرات النموذج إلى سلوكيات معقدة.

هذا البحث لا يسلط الضوء فقط على تلك المكونات، بل يستكشف ثلاث تحديات رئيسية في توسيع الأنظمة: حوكمة السياق، والذاكرة الموثوقة، وتوجيه المهارات الديناميكي، إلى جانب الآليات التي تنسق بين هذه العناصر. كما تم تقديم مشروع "CheetahClaws"، وهو نموذج مرجعي متاح بلغة بايثون، للمقارنة مع مشروعات أخرى مثل "Claude Code" و"OpenClaw".

ما نعتبره أساسياً هو أن التقدم في الذكاء الاصطناعي الاستدلالي يعتمد على تصميم الأنظمة بقدر اعتمادها على قوة نماذج الأساس. لهذا السبب، ندعو الباحثين إلى تقديم اختبارات معيارية جديدة تقيس ليس فقط النجاح في المهام العادية، ولكن أيضاً جودة المسارات والتأكيد على السلامة مع مرور الوقت.

هل أنتم مستعدون لاستكشاف هذا التحول المهم في الذكاء الاصطناعي؟ شاركونا آرائكم في التعليقات!