ميزات SAGE-32B
يعمل SAGE-32B من خلال ما يعرف بـ "حلقة وكيلية"، مما يُمكّنه من التعامل مع مهام معقدة عبر استخدام أدوات متنوعة واستعادة من الأخطاء بفعالية. يعتمد هذا النموذج على نسخة محسنة من النموذج pretrained Qwen2.5-32B، حيث شهد عملية تدريب متقدمة تعرف باسم "التقطير التكراري" (Iterative Distillation)، وهي عملية تدريب مكونة من مرحلتين تهدف إلى تحسين الأداء المنطقي من خلال حلقات تغذية راجعة تم اختبارها بدقة.
التفكير العكسي كميزة مبتكرة
أحد الجوانب الفريدة في SAGE-32B هو استخدامه لطريقة التفكير العكسي (Inverse Reasoning)، حيث يدمج "رأس إدراك ميتا" (Meta Cognition Head) للتنبؤ بالإخفاقات المحتملة في عملية التخطيط قبل التنفيذ. يساعد هذا النهج على تحسين إمكانية نجاح النموذج في عمليات الاستخدام المتعدد للأدوات، مما يجعل SAGE-32B متفوقاً على النماذج المماثلة في الأداء.
نتائج مبهرة وفوائد مستقبلية
تم اختبار SAGE-32B على معايير التفكير الوكيلي مثل MMLU-Pro وAgentBench وMATH-500، وحقق معدلات نجاح أعلى في سيناريوهات استخدام الأدوات المتعددة مقارنةً بالنماذج المرجعية ذات الحجم المماثل، مع الحفاظ على تنافسية عالية في التقييمات القياسية للتفكير.
خلاصة
بتوفير هذا النموذج للجمهور عبر منصة Hugging Face، يفتح الفرص للباحثين والمطورين لاستكشاف الإمكانيات الجديدة في مجالات متعددة. هل أنتم مستعدون لتجربة SAGE-32B والتعرف على إمكانياته؟
ما رأيكم في هذا التطور؟ شاركونا في التعليقات!
