في عالم الذكاء الاصطناعي، تعتبر نماذج اللغة الصغيرة (Small Language Models) أداة قوية خاصة عند نشرها على الأجهزة الطرفية. ومع ذلك، يتطلب الأمر تقنيات ضبط دقيق (Fine-Tuning) فعالة لتكييف هذه النماذج مع مهام جديدة، دون أن يؤثر ذلك سلباً على قدراتها العامة.

في دراسة حديثة تم من خلالها تقييم خمسة نماذج صغيرة تحتوي على أقل من مليار معلمة (135M-1B) في مهام التفكير الرياضي، تم الكشف عن ثغرة حاسمة: الضبط الكامل (Full Fine-Tuning) قد يضر الأداء بشكل فعلي في النماذج التي تحتوي على أقل من 300 مليون معلمة، بل يمكن أن تقلل الدقة عن معايير الصفر (zero-shot).

يُظهر هذا النوع من التأثير ما يعرف بـ "النقل السالب" (Negative Transfer)، مما يجعل استخدام تقنيات الضبط الدقيق الفعّال مثل Parameter-Efficient Fine-Tuning (PEFT) ليس مجرد خيار للكفاءة، بل ضرورة لضمان استقرار الأداء.

وفي سياق التقنيات المتاحة، أظهرت النتائج أن تقنيات مثل Low-Rank Adaptation (LoRA) وWeight-Decomposed LoRA (DoRA) تؤدي وظيفتها بكفاءة، لكن أداءها يختلف بحسب المهمة. حيث يتفوق DoRA في مهام التفكير المعقد (مثل GSM8K) بينما تهيمن LoRA على مهام مطابقة الأنماط (OrcaMath). ومع ذلك، يبدو أن الضبط الكامل لا يزال أقل فعالية مقارنةً بـ LoRA في النماذج المتوافقة (مثل Qwen2.5-0.5B) أو حتى مع نماذج صغيرة جداً (مثل SmolLM2-135M) باستخدام تقنيات التعلم السياقي (In-Context Learning) بخمس تجارب.

بناءً على هذه النتائج، يُنصح بالاعتماد على PEFT كنموذج افتراضي لجميع النماذج المتوافقة تحت 1 مليار معلمة، مع توخي الحذر من استخدام الضبط الكامل لأي نموذج يحتوي على أقل من 500 مليون معلمة لتجنب النسيان الكارثي.

إذا كنت مهتماً بتفاصيل أكثر حول كيفية تنفيذ هذه التقنيات، يمكن العثور على إعادة إنتاج لهذه الدراسة على GitHub.