في عالم الذكاء الاصطناعي، تبرز أهمية تحسين الزيرو-أردر (Zeroth-Order Optimization) كأداة محورية خاصة في الحالات التي يمنع فيها العودة (Backpropagation) مثل التعلم على الأجهزة ذات الذاكرة المحدودة. لكن، تكافح الأساليب الحالية في هذا المجال مع معضلة واضحة: إما أنها تعاني من ضعف كفاءة الاستفادة من العينات أو تتعرض لتقلبات عالية بسبب التقديرات العشوائية.

في البحث الجديد، يتم تقديم تقنية مبتكرة تُعرف باسم 'Coherent Coordinate Descent' (CoCD)، وهي محسن زيرو-أردر فعال وقائم على العينة، يساعد في تقليل التكاليف. من الناحية النظرية، يتم تقديم مفهوم التوافق بين التدرجات، حيث تُظهر الدراسة أن CoCD يمكن اعتباره معادلاً لطريقة النزول بالدورات (Block Cyclic Coordinate Descent) مع ما يُعرف بـ'البدايات الدافئة'، مما يحول التدرجات التاريخية من عبء إلى أداة حسابية مفيدة.

تتيح هذه الآلية فعالية في استعلامات الـ $O(1)$ لكل خطوة مع الحفاظ على المسارات العامة للنزول. علاوة على ذلك، توصل الباحثون إلى حدود خطأ تكشف عن فكرة غير بديهية: إن زيادة أحجام خطوات الفروقات النهائية يمكن أن تدفع تأثير التنعيم الضمني في المشهد الأمثل من خلال تقليل ثابت النعومة الفعّالة، مما يعزز من استقرار التقارب.

تجارب أجريت على هياكل الشبكات العصبية المتعددة الطبقات مثل MLP وCNN وResNet (حتى 270 ألف معلمة) تظهر تفوق CoCD بشكل كبير من حيث كفاءة العينة وخسارة التقارب/الدقة، فضلًا عن استقراره الفائق مقارنة بأساليب الزيرو-أردر العشوائية.

تشير النتائج إلى أن التحديثات المحددة والواعية للبنية تقدم بديلاً متفوقًا على العشوائية لتحسين الزيرو-أردر الخفيف.