في عالم الذكاء الاصطناعي، يتزايد الاعتماد على [نماذج [اللغات](/tag/اللغات) الكبيرة](/tag/[نماذج](/tag/نماذج)-[اللغات](/tag/اللغات)-الكبيرة) ([LLMs](/tag/llms)) لتعزيز [الأداء](/tag/الأداء) والكفاءة. ومع ذلك، تجد هذه [النماذج](/tag/النماذج) نفسها في [تحديات](/tag/تحديات) كبيرة لاستغلال مواردها بشكل أمثل. هنا يأتي دور [GAMMA](/tag/gamma) - [نظام ذكي](/tag/نظام-[ذكي](/tag/ذكي)) يهدف إلى [تحسين](/tag/تحسين) توزيع [الدقة](/tag/الدقة) في [نماذج الذكاء الاصطناعي](/tag/[نماذج](/tag/نماذج)-الذكاء-الاصطناعي) من خلال [تقنية](/tag/تقنية) [التكميم المختلط](/tag/[التكميم](/tag/التكميم)-المختلط) (Mixed-Precision [Quantization](/tag/quantization)).
كيف يعمل [GAMMA](/tag/gamma)؟ يعتمد هذا النظام على أتاحة [تخصيص](/tag/تخصيص) [عدد](/tag/عدد) أكبر من البتات (Bits) للوحدات الأكثر حساسية، مما يحقق توازنًا بين الميزانية المستهلكة والدقة المطلوبة. وبفضل نهج مبتكر، يتيح [GAMMA](/tag/gamma) إجراء [تحسينات](/tag/تحسينات) في عملية [تخصيص](/tag/تخصيص) [الدقة](/tag/الدقة) بشكل تلقائي، مما يقلل من التعقيدات المرتبطة بالتدريب والتقييم التقليدي.
حيث يتجاوز [GAMMA](/tag/gamma) التحديات التي تواجه [نماذج الذكاء الاصطناعي](/tag/[نماذج](/tag/نماذج)-الذكاء-الاصطناعي) ذات المليارات من المعلمات، من خلال الاستفادة من [البيانات](/tag/البيانات) المتاحة بعد [التدريب](/tag/التدريب). يقوم البرنامج بتحسين هدف إعادة [بناء](/tag/بناء) الحالة الخفية باستخدام [قيود](/tag/قيود) لاجرانج الموسعة، ويحول [التفضيلات](/tag/التفضيلات) المكتسبة إلى تخصيصات دقيقة وقابلة للتطبيق عن طريق [البرمجة](/tag/البرمجة) الصحيحة.
تتمثل [الميزة](/tag/الميزة) الأساسية في إعادة استخدام الدرجات، مما يعني أنه يمكن استخدام [تفضيلات](/tag/تفضيلات) [الدقة](/tag/الدقة) التي تم تعلمها [عبر](/tag/عبر) [نماذج](/tag/نماذج) مختلفة، مما يسهل الانتقال بين الأهداف المختلفة دون الحاجة لإعادة التدريب، حيث يمكن تقليل وقت [التكيف](/tag/التكيف) من [ساعات](/tag/ساعات) إلى دقائق معدودة.
أظهرت [نتائج التجارب](/tag/نتائج-[التجارب](/tag/التجارب)) على [نماذج](/tag/نماذج) [Llama](/tag/llama) وQwen ذات المعلمات التي تتراوح بين 8B و32B، أن [GAMMA](/tag/gamma) يتفوق على الطرق التقليدية بالتحسينات نسبة تصل إلى +12.99% مقارنة بالأداء الثابت، كما أنه يوفر جودة تساوي [أداء](/tag/أداء) 3 بت باستخدام [دقة](/tag/دقة) متوسطة تبلغ 2.5 بت.
GAMMA: نظام مبتكر لتحسين توزيع الدقة في نماذج الذكاء الاصطناعي
GAMMA هو إطار عمل ثوري يهدف إلى تحسين توزيع الدقة في نماذج اللغات الكبيرة (LLMs) باستخدام تقنية التكميم المختلط. يقدم هذا النظام حلاً مبتكرًا يجمع بين الكفاءة والدقة دون حاجة لإعادة التدريب.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
