تتجه الأنظار اليوم نحو نماذج اللغة الضخمة (LLMs) ودورها المتزايد في توفير تجارب شخصية للمستخدمين. ومع زيادة استخدام هذه النماذج، تظهر تحديات كبيرة في إدارة الموارد، خاصة في الأجهزة المحمولة. تعتبر عملية Fine-tuning باستخدام تقنية التكيف منخفض الرتبة (LoRA) طريقة فعالة لتحسين أداء هذه النماذج، ولكنها تواجه عقبة كبيرة تتمثل في قيود الذاكرة على الأجهزة الاستهلاكية.
تتفوق تقنيات Fine-tuning على تحديات الذاكرة من خلال توفير حل متكامل يقلل من الحجم الإجمالي للذاكرة المستخدمة دون المساس بجودة النموذج. تتضمن هذه التقنيات:
1. **تحويل نموذج الأساس إلى صيغة مضغوطة** مع إمكانية فك الضغط في الوقت الفعلي، مما يقلل من الحمل على الذاكرة.
2. **تخزين نقاط التفتيش بكفاءة** عن طريق دمج التخزين الانتقائي للعمليات المتوقفة وعمليات الإخراج من القرص، مما يسهل إدارة الذاكرة.
3. **تقريب softmax** باستخدام مجموعات رموز ذات دلالات ذات صلة، مما يحد من استهلاك الذاكرة.
4. **إخفاء logits** لتحقيق أداء محسّن من خلال معالجة الرموز الأكثر أهمية.
أظهرت التجارب التي تمت على نماذج مثل Llama-3.2 3B وQwen-2.5 3B تقليلاً في ذروة الذاكرة يصل إلى 26 ضعفًا و28 ضعفًا على التوالي، مما يمكّن عملية Fine-tuning على أجهزة ذات موارد محدودة. هذا الابتكار يمثل نقلة نوعية في كيفية استخدام نماذج اللغة الضخمة في بيئات الاستهلاك العادي، حيث يجمع بين الأداء العالي والحفاظ على الخصوصية.
ما رأيكم في هذا التطور المثير؟ شاركونا في التعليقات.
تقنيات مبتكرة لتقليل الذاكرة أثناء عملية Fine-tuning لنماذج اللغة الضخمة على الأجهزة المحمولة
تقدم الورقة مجموعة من التقنيات الفعالة لتقليل استهلاك الذاكرة أثناء Fine-tuning نماذج اللغة الضخمة (LLMs)، مما يمكّن استخدامها على الأجهزة ذات القدرات المحدودة. هذه الحلول تعزز الخصوصية وتجربة المستخدم دون التأثير على جودة النموذج.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
