في عالم [الذكاء الاصطناعي](/tag/الذكاء-الاصطناعي) المتغير بسرعة، تظهر [تقنية جديدة](/tag/[تقنية](/tag/تقنية)-جديدة) تُعرف بـ AR1-ZO، والتي تعدّ بمثابة نقطة تحوّل في [تحسين](/tag/تحسين) [نماذج [اللغة](/tag/اللغة) الكبيرة](/tag/[نماذج](/tag/نماذج)-[اللغة](/tag/اللغة)-الكبيرة). تعتمد هذه [التقنية](/tag/التقنية) على [تحسين](/tag/تحسين) الوصول إلى متواليات من الطبقات المقيدة بالرتبة (Rank-1) باستخدام [تقنيات](/tag/تقنيات) تسليم للبيانات تعرف بـ Zeroth-order optimization (ZO).

تتيح ZO [تحسين](/tag/تحسين) [نماذج اللغة](/tag/[نماذج](/tag/نماذج)-[اللغة](/tag/اللغة)) بشكل فعال دون الحاجة لتخزين [تنشيط](/tag/تنشيط) [البيئة](/tag/البيئة) الخلفية، مما يقلل من الحاجة للموارد. لكن ما هو سر هذه [التقنية](/tag/التقنية)؟ يأتي استبدال المعلمات باستخدام LoRA، وهو نظام يوفر موصلات قابلة للتدريب بشكل مضغوط.

ومع ذلك، تواجه هذه التقنيات ما يعرف ببارادوكس الرتبة - حيث أن زيادة رتبة [LoRA](/tag/lora) تعزز من قدرة الموصل، ولكنها تؤدي أيضاً إلى إرباكات في قياسات البعد المرتبطة بالاعتبارات الفنية الخاصة بها.

تكشف [الأبحاث](/tag/الأبحاث) أن المشكلة تكمن في [قياس](/tag/قياس) topology بدلاً من الحاجة لوجود [فضاء](/tag/فضاء) فرعي خارجي. يقوم [LoRA](/tag/lora) بتحطيمه إلى ذرات ذات رتبة متطابقة $1$، مما يوفر مدخلات عميقة لآلية السيطرة على [الأداء](/tag/الأداء).

تستعرض [دراسة](/tag/دراسة) حديثة كيفية استخدام AR1-ZO من خلال جمع استفسارات ذرات الرتبة-1 وتقنيات [قياس](/tag/قياس) واعية بالتtopology، مما يستعيد إشارة نشطة غير معتمدة على الرتبة دون الحاجة لأسس مساعدة أو تقديرات انحناء.

[نتائج التجارب](/tag/نتائج-[التجارب](/tag/التجارب)) على [نماذج](/tag/نماذج) OPT وQwen3 تظهر أن AR1-ZO فعالة جداً ضمن ميزانيات استفسار ZO التي تعتمد على جولتتين أماميتين، مما يحقق نتائج مثمرة في الوصول للأداء المثالي.

هذا التحول في [استراتيجيات](/tag/استراتيجيات) [تحسين](/tag/تحسين) [نماذج [اللغة](/tag/اللغة) الكبيرة](/tag/[نماذج](/tag/نماذج)-[اللغة](/tag/اللغة)-الكبيرة) يفتح أمامنا آفاق جديدة، هل أنتم مستعدون لاستكشاف المزيد حول عالم [الذكاء الاصطناعي](/tag/الذكاء-الاصطناعي)؟