في عصر الذكاء الاصطناعي، أصبحت نماذج اللغة الضخمة (Large Language Models - LLMs) محط أنظار الباحثين والمطورين حول العالم، بفضل قدراتها الاستدلالية اللافتة. ومع تزايد الاهتمام بتوسع استخدام هذه النماذج في مجالات متعددة مثل الرياضيات والترميز، وُجدت تقنية جديدة تُعرف بالتوسع في الحساب أثناء الاختبار (Test-Time Compute Scaling - TTS) التي تعكس أداءً متميزًا في اختبار الأداء.

على الرغم من النجاح الباهر، تواجه هذه النماذج تحديات كبيرة، لذا تركز الأبحاث على تقنيات تقليم النماذج؛ وهي الطرق التي تهدف إلى إزالة المعلمات الزائدة أو الضارة دون التأثير على الأداء الوظيفي. لكن هل لهذا التقليم تأثير حقيقي على الأداء في أوقات الاختبار؟

في دراسة جديدة، تم اختبار تأثير تقنيات التقليم الهيكلية (Structured Pruning) وتقليم غير الهيكلية (Unstructured Pruning) على نماذج اللغة الضخمة s1.1-7B وQwen3-8B عبر أربع معايير استدلالية. أظهرت النتائج المثيرة أن التقليم غير الهيكلي لا يقتصر فقط على الحفاظ على الأداء، بل قد يؤدي في بعض الحالات إلى تحسين الأداء مقارنة بالنموذج الكامل.

تُظهر هذه التجارب أن الأساليب غير الهيكلية يمكن أن تعكس تفوقًا ملحوظًا في الأداء، مما يتحدى الفرضيات التقليدية بأن التقليم دائمًا ما يقلل من فعالية TTS. كما تم دراسة تأثير استراتيجيات تخصيص التباين عبر الطبقات، وهو عامل حاسم لتطبيق هذه الأساليب غير الهيكلية.

هذه النتائج تستدعي إعادة التفكير في الاستراتيجيات المستخدمة في تقليم النماذج وتفتح آفاق جديدة لتحسين أدائها. فهل تعتقدون أنه يمكن أن يحدث تغيير كبير في طريقة تطوير نماذج اللغة الضخمة مستقبلاً؟ شاركونا آراءكم في التعليقات!