أصبحت [نماذج [اللغات](/tag/اللغات) الضخمة](/tag/[نماذج](/tag/نماذج)-[اللغات](/tag/اللغات)-الضخمة) (Large Language [Models](/tag/models)) ركيزة أساسية في الذكاء الاصطناعي، حيث يتم تطويرها لتلبية متطلبات محددة وسلوكيات معينة [عبر](/tag/عبر) عملية تعرف بالتوجيه ما بعد [التدريب](/tag/التدريب). ومع ذلك، تواجه التقنيات التقليدية المستخدمة في هذا المجال عدة تحديات، بما في ذلك الوقت الطويل والتكاليف المرتفعة، فضلاً عن عدم [دقة](/tag/دقة) [التحكم](/tag/التحكم) في النتائج الناتجة عن الأساليب التقليدية مثل [التعلم المعزز](/tag/[التعلم](/tag/التعلم)-المعزز) ([Reinforcement Learning](/tag/reinforcement-learning)) والتوجيه الخاضع للإشراف (Supervised Fine-Tuning).
لتجاوز هذه التحديات، تم تقديم مفهوم "[تحكم](/tag/تحكم) [تنشيط](/tag/تنشيط) خالٍ من [الألم](/tag/الألم)" (Painless Activation Steering - PAS)، الذي يعد نهجًا مبتكرًا وأوتوماتيكيًا بالكامل. هذه الطريقة الجديدة تُجري [تحسينات](/tag/تحسينات) فعّالة باستخدام أي [مجموعة بيانات](/tag/مجموعة-[بيانات](/tag/بيانات)) مُعلمة، دون الحاجة لبناء [تفضيلات](/tag/تفضيلات) أو تصنيفات معقدة، وبدون الحاجة لتدخل بشري مستمر.
لقد تم اختبار PAS على ثلاث [نماذج مفتوحة](/tag/[نماذج](/tag/نماذج)-مفتوحة) (Llama3.1-8B-Instruct، [DeepSeek](/tag/deepseek)-R1-Distill-8B، وNous-Hermes-2) وثمانية عشر مهمة مختلفة، مما أظهر تحسنًا ملحوظًا في الأداء، خاصة في المهام المرتبطة بالسلوك. ومع ذلك، لم [تحقق](/tag/تحقق) نجاحًا متسقًا في المهام المعنية بالذكاء.
واحدة من المزايا المذهلة لـ PAS هي النسخة الاستقصائية (iPAS)، التي حققت أقوى [تأثيرات](/tag/تأثيرات) [تحكم](/tag/تحكم) سببية، حيث تم تسجيل [تحسينات](/tag/تحسينات) بنسبة 10.1% في الانحياز، و5.2% في الأخلاق، و34.8% في [التوافق](/tag/التوافق). كما أن PAS تعزز [الأداء](/tag/الأداء) الإضافي عند استخدامه بالتوازي مع [تقنيات التعلم](/tag/[تقنيات](/tag/تقنيات)-[التعلم](/tag/التعلم)) داخل [السياق](/tag/السياق) (In-Context Learning) وSFT.
تقدم نتائجنا [رؤى](/tag/رؤى) [قيمة](/tag/قيمة) حول المجالات التي ينفع فيها [تحكم](/tag/تحكم) التنشيط، وأين قد يفشل، وكيفية تطبيقه كخيار عملي لتحسين [نماذج [اللغات](/tag/اللغات) الضخمة](/tag/[نماذج](/tag/نماذج)-[اللغات](/tag/اللغات)-الضخمة). هل أنتم مستعدون لاستكشاف الجيل الجديد من [تقنيات الذكاء الاصطناعي](/tag/[تقنيات](/tag/تقنيات)-الذكاء-الاصطناعي)؟ شاركونا آرائكم وتجاربكم في [التعليقات](/tag/التعليقات)!
تحكم تنشيط خالٍ من الألم: نهج آلي وخفيف لتهيئة نماذج اللغات الضخمة بعد التدريب
تقدم طرق تحكم تنشيط خالٍ من الألم (PAS) حلاً آليًا يتيح تحسين أداء نماذج اللغات الضخمة بسهولة وسرعة، دون الحاجة لتدخل بشري. تم تقييم هذه الطرق على نماذج متعددة وأظهرت نتائج مبهرة في تحسين سلوكيات معينة.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
