شهدت تقنيات تعديل التعليمات (Instruction Finetuning) تطوراً ملحوظاً في السنوات الأخيرة، حيث تم استخدام الضجيج في التضمينات (Embeddings) لتحقيق تحسينات فعالة. واحدة من أبرز هذه الابتكارات هي تقنية NEFTune، التي أظهرت من خلال دراسات تجريبية أن الضجيج المتساوي يتفوق على الضجيج الغاوسي. لكن، تبقى الأسباب وراء هذا التفوق غير واضحة.

في سبيل تسليط الضوء على هذا الجانب الغامض، يقدم هذا البحث تحليلاً شاملاً يتجاوز الحدود النظرية إلى التجريبية، مؤكداً أن كل من الضجيج المتساوي والغاوسي يمكن أن يحقق أداءً متماثلاً. كما نعمل على تقديم تقنية جديدة في تعديل نماذج اللغة تُعرف باسم SymNoise، والتي تستفيد من استخدام ضجيج متماثل في التضمينات، بغرض تحسين أداء النموذج من خلال تنظيم أكثر دقة للتقوس المحلي.

عند تطبيق هذه الطريقة على نموذج LLaMA-2-7B باستخدام Alpaca، حققت التقنيات التقليدية درجة 29.79% في AlpacaEval. لكن، استخدمت طريقة SymNoise، التي تعتمد على التضمينات المزعجة المتماثلة، لتحقيق درجة أعلى بكثير بلغت 69.04%. هذه النتيجة تمثل تحسناً بنسبة 6.7% مقارنة بالأسلوب الرائد الحالي NEFTune الذي حقق 64.69%.

ولتعزيز موثوقية النتائج، تم اختبار SymNoise على مجموعة متنوعة من النماذج ومجموعات بيانات أقوى مثل Evol-Instruct وShareGPT وOpenPlatypus، حيث أثبتت هذه الطريقة تفوقها المستمر على NEFTune.

تسلط الأدبيات الحالية، بما في ذلك NEFTune، الضوءعلى أهمية البحث المتعمق في تطبيق استراتيجيات قائمة على الضجيج في تعديل نماذج اللغة. نجاحنا في تطبيق SymNoise يمثل خطوة كبيرة في هذا الاتجاه، ويظهر تحسناً ملحوظاً عن التقنية الرائدة الحالية، مما يفتح آفاقاً جديدة للتطور في هذا المجال.