في عالم الذكاء الاصطناعي، يمثل التفكير الهجين خطوة جديدة في تطوير نماذج اللغة. لكن كيف يمكن تحسين هذه النماذج للحد من تسرب التفكير وضمان فعالية أعلى في الأداء؟ هنا تأتي تقنية Path-Lock Expert (PLE) لتقدم لنا إجابات واعدة.

تسمح نماذج التفكير الهجين (Hybrid-thinking Language Models) بوجود وضعين واضحين: وضع التفكير (Think Mode) ووضع عدم التفكير (No-think Mode). إلا أن التصاميم الحالية تعاني من عدم الفصل الواضح بين هذين الوضعين، مما يؤدي إلى تدفق ردود طويلة وتفكر ذاتي غير مرغوب فيه حتى في وضع عدم التفكير. لقد تم العمل عبر تحسين البيانات والتدريب متعدد المراحل للحد من هذه المشكلة، لكن تسرب التفكير لا يزال يمثل تحديًا بسبب ذلك الترميز المشترك بين وضعي التفكير.

لذا، تأتي PLE كحل مبتكر على مستوى الهيكل، حيث تستبدل الشبكة العصبية متعددة الطبقات (MLP) الموجودة في كل طبقة من وحدات التشفير بخبراء محددين وسلكيين، واحد لأسلوب التفكير والآخر لأسلوب عدم التفكير. توفر هذه الميزة تمييزًا واضحًا بين الاتجاهات المستخدمة في كل نمط من أنماط التفكير، مما يؤدي إلى تحسين الأداء في كلا الوضعين.

يعمل بروتوكول توجيه التحكم (Control-Token Router) على اختيار مسار خبير واحد بالضبط لكامل التسلسل، مما يضمن أن كل خبير يتلقى تحديثات نقية تحت إشراف التدريب. في اختبار الأداء على معايير التفكير الرياضي والعلمي، تحافظ PLE على أداء قوي في حالة التفكير، بينما تعزز من دقة حالة عدم التفكير بشكل كبير، مما يجعلها أكثر دقة واقتصادية.

على سبيل المثال، في نموذج Qwen3-4B، تمكنت PLE من تقليل الرموز الانعكاسية في حالة عدم التفكير من 2.54 إلى 0.39، وزيادة دقة عدم التفكير من 20.67% إلى 40.00%، مما يظهر فعالية هذا التصميم الجديد.

تظهر هذه النتائج أن التحكم في التفكير الهجين هو في الأساس مشكلة هيكلية، حيث يُعَد الفصل بين مسارات التغذية الراجعة الخاصة بكل نمط حلاً بسيطًا وفعالًا.