أصبحت نماذج اللغات الضخمة (Large Language Models) ركيزة أساسية في الذكاء الاصطناعي، حيث يتم تطويرها لتلبية متطلبات محددة وسلوكيات معينة عبر عملية تعرف بالتوجيه ما بعد التدريب. ومع ذلك، تواجه التقنيات التقليدية المستخدمة في هذا المجال عدة تحديات، بما في ذلك الوقت الطويل والتكاليف المرتفعة، فضلاً عن عدم دقة التحكم في النتائج الناتجة عن الأساليب التقليدية مثل التعلم المعزز (Reinforcement Learning) والتوجيه الخاضع للإشراف (Supervised Fine-Tuning).

لتجاوز هذه التحديات، تم تقديم مفهوم "تحكم تنشيط خالٍ من الألم" (Painless Activation Steering - PAS)، الذي يعد نهجًا مبتكرًا وأوتوماتيكيًا بالكامل. هذه الطريقة الجديدة تُجري تحسينات فعّالة باستخدام أي مجموعة بيانات مُعلمة، دون الحاجة لبناء تفضيلات أو تصنيفات معقدة، وبدون الحاجة لتدخل بشري مستمر.

لقد تم اختبار PAS على ثلاث نماذج مفتوحة (Llama3.1-8B-Instruct، DeepSeek-R1-Distill-8B، وNous-Hermes-2) وثمانية عشر مهمة مختلفة، مما أظهر تحسنًا ملحوظًا في الأداء، خاصة في المهام المرتبطة بالسلوك. ومع ذلك، لم تحقق نجاحًا متسقًا في المهام المعنية بالذكاء.

واحدة من المزايا المذهلة لـ PAS هي النسخة الاستقصائية (iPAS)، التي حققت أقوى تأثيرات تحكم سببية، حيث تم تسجيل تحسينات بنسبة 10.1% في الانحياز، و5.2% في الأخلاق، و34.8% في التوافق. كما أن PAS تعزز الأداء الإضافي عند استخدامه بالتوازي مع تقنيات التعلم داخل السياق (In-Context Learning) وSFT.

تقدم نتائجنا رؤى قيمة حول المجالات التي ينفع فيها تحكم التنشيط، وأين قد يفشل، وكيفية تطبيقه كخيار عملي لتحسين نماذج اللغات الضخمة. هل أنتم مستعدون لاستكشاف الجيل الجديد من تقنيات الذكاء الاصطناعي؟ شاركونا آرائكم وتجاربكم في التعليقات!