في عالم الذكاء الاصطناعي، يتزايد الاعتماد على [نماذج [اللغات](/tag/اللغات) الكبيرة](/tag/[نماذج](/tag/نماذج)-[اللغات](/tag/اللغات)-الكبيرة) ([LLMs](/tag/llms)) لتعزيز [الأداء](/tag/الأداء) والكفاءة. ومع ذلك، تجد هذه [النماذج](/tag/النماذج) نفسها في [تحديات](/tag/تحديات) كبيرة لاستغلال مواردها بشكل أمثل. هنا يأتي دور [GAMMA](/tag/gamma) - [نظام ذكي](/tag/نظام-[ذكي](/tag/ذكي)) يهدف إلى [تحسين](/tag/تحسين) توزيع [الدقة](/tag/الدقة) في [نماذج الذكاء الاصطناعي](/tag/[نماذج](/tag/نماذج)-الذكاء-الاصطناعي) من خلال [تقنية](/tag/تقنية) [التكميم المختلط](/tag/[التكميم](/tag/التكميم)-المختلط) (Mixed-Precision [Quantization](/tag/quantization)).

كيف يعمل [GAMMA](/tag/gamma)؟ يعتمد هذا النظام على أتاحة [تخصيص](/tag/تخصيص) [عدد](/tag/عدد) أكبر من البتات (Bits) للوحدات الأكثر حساسية، مما يحقق توازنًا بين الميزانية المستهلكة والدقة المطلوبة. وبفضل نهج مبتكر، يتيح [GAMMA](/tag/gamma) إجراء [تحسينات](/tag/تحسينات) في عملية [تخصيص](/tag/تخصيص) [الدقة](/tag/الدقة) بشكل تلقائي، مما يقلل من التعقيدات المرتبطة بالتدريب والتقييم التقليدي.

حيث يتجاوز [GAMMA](/tag/gamma) التحديات التي تواجه [نماذج الذكاء الاصطناعي](/tag/[نماذج](/tag/نماذج)-الذكاء-الاصطناعي) ذات المليارات من المعلمات، من خلال الاستفادة من [البيانات](/tag/البيانات) المتاحة بعد [التدريب](/tag/التدريب). يقوم البرنامج بتحسين هدف إعادة [بناء](/tag/بناء) الحالة الخفية باستخدام [قيود](/tag/قيود) لاجرانج الموسعة، ويحول [التفضيلات](/tag/التفضيلات) المكتسبة إلى تخصيصات دقيقة وقابلة للتطبيق عن طريق [البرمجة](/tag/البرمجة) الصحيحة.

تتمثل [الميزة](/tag/الميزة) الأساسية في إعادة استخدام الدرجات، مما يعني أنه يمكن استخدام [تفضيلات](/tag/تفضيلات) [الدقة](/tag/الدقة) التي تم تعلمها [عبر](/tag/عبر) [نماذج](/tag/نماذج) مختلفة، مما يسهل الانتقال بين الأهداف المختلفة دون الحاجة لإعادة التدريب، حيث يمكن تقليل وقت [التكيف](/tag/التكيف) من [ساعات](/tag/ساعات) إلى دقائق معدودة.

أظهرت [نتائج التجارب](/tag/نتائج-[التجارب](/tag/التجارب)) على [نماذج](/tag/نماذج) [Llama](/tag/llama) وQwen ذات المعلمات التي تتراوح بين 8B و32B، أن [GAMMA](/tag/gamma) يتفوق على الطرق التقليدية بالتحسينات نسبة تصل إلى +12.99% مقارنة بالأداء الثابت، كما أنه يوفر جودة تساوي [أداء](/tag/أداء) 3 بت باستخدام [دقة](/tag/دقة) متوسطة تبلغ 2.5 بت.