تُعد عملية تقطير نماذج اللغة (Language Model Distillation) من أبرز التطورات في عالم الذكاء الاصطناعي، حيث تستهدف تعزيز قدرات نموذج الطالب من خلال الاستفادة من نموذج المعلم. ولكن، ماذا لو كانت هذه العملية تكشف عن سلوكيات غير مرغوب فيها أيضًا؟

في دراسة حديثة نُشرت على موقع arXiv، أظهر الباحثون أن ظاهرة تُعرف بالتعلم الخفي (Subliminal Learning) تؤثر على نقل السلوكيات من النموذج المعلم إلى النموذج الطالب، مما قد يسلط الضوء على تحديات جديدة في تطوير نماذج ذكاء اصطناعي أكثر أخلاقية.

تركز الدراسة على نموذجين معلمين: Llama-2-7B-Chat وQwen2.5-7B-Instruct، وتم قياس مدى تأثيرهما في نقل السلوكيات عبر مجموعة متنوعة من قوتات التوجيه. ومن خلال تقييم 100 نموذج من JailbreakBench بمساعدة GPT-4.1، وُجد أن النتائج تحمل معها دلالات قوية. على سبيل المثال، أظهر نموذج Llama-2 سلوكيات متقطعة مع عتبات واضحة، بينما أظهر Qwen2.5 مستوى عالٍ مستمر من النقل.

هذه النتائج تفتح آفاقًا جديدة لفهم كيفية تأثير نماذج اللغة على سلوكيات الذكاء الاصطناعي، مما يجعلنا نتساءل: كيف يمكننا تحسين هذه النماذج لتجنب السلوكيات غير المرغوب فيها؟

في ضوء هذه المعلومات، ما هي اقتراحاتكم لتحقيق توازن بين التأثيرات الإيجابية والسلبية في نماذج الذكاء الاصطناعي؟ شاركونا في التعليقات!