في عالم الذكاء الاصطناعي، يتزايد الاعتماد على نماذج اللغات الكبيرة (LLMs) لتعزيز الأداء والكفاءة. ومع ذلك، تجد هذه النماذج نفسها في تحديات كبيرة لاستغلال مواردها بشكل أمثل. هنا يأتي دور GAMMA - نظام ذكي يهدف إلى تحسين توزيع الدقة في نماذج الذكاء الاصطناعي من خلال تقنية التكميم المختلط (Mixed-Precision Quantization).
كيف يعمل GAMMA؟ يعتمد هذا النظام على أتاحة تخصيص عدد أكبر من البتات (Bits) للوحدات الأكثر حساسية، مما يحقق توازنًا بين الميزانية المستهلكة والدقة المطلوبة. وبفضل نهج مبتكر، يتيح GAMMA إجراء تحسينات في عملية تخصيص الدقة بشكل تلقائي، مما يقلل من التعقيدات المرتبطة بالتدريب والتقييم التقليدي.
حيث يتجاوز GAMMA التحديات التي تواجه نماذج الذكاء الاصطناعي ذات المليارات من المعلمات، من خلال الاستفادة من البيانات المتاحة بعد التدريب. يقوم البرنامج بتحسين هدف إعادة بناء الحالة الخفية باستخدام قيود لاجرانج الموسعة، ويحول التفضيلات المكتسبة إلى تخصيصات دقيقة وقابلة للتطبيق عن طريق البرمجة الصحيحة.
تتمثل الميزة الأساسية في إعادة استخدام الدرجات، مما يعني أنه يمكن استخدام تفضيلات الدقة التي تم تعلمها عبر نماذج مختلفة، مما يسهل الانتقال بين الأهداف المختلفة دون الحاجة لإعادة التدريب، حيث يمكن تقليل وقت التكيف من ساعات إلى دقائق معدودة.
أظهرت نتائج التجارب على نماذج Llama وQwen ذات المعلمات التي تتراوح بين 8B و32B، أن GAMMA يتفوق على الطرق التقليدية بالتحسينات نسبة تصل إلى +12.99% مقارنة بالأداء الثابت، كما أنه يوفر جودة تساوي أداء 3 بت باستخدام دقة متوسطة تبلغ 2.5 بت.
GAMMA: نظام مبتكر لتحسين توزيع الدقة في نماذج الذكاء الاصطناعي
GAMMA هو إطار عمل ثوري يهدف إلى تحسين توزيع الدقة في نماذج اللغات الكبيرة (LLMs) باستخدام تقنية التكميم المختلط. يقدم هذا النظام حلاً مبتكرًا يجمع بين الكفاءة والدقة دون حاجة لإعادة التدريب.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
