في عالم الأجهزة المدمجة، تتطلب تطبيقات التعلم المعزز المستمر تحقيق توازن دقيق بين التأخير الزمني وميزانية الطاقة. تعتبر وحدات FPGAs الصغيرة (Field-Programmable Gate Arrays) حلاً واعدًا لهذا التحدي، ولكن يتطلب الأمر تجنب خطوط الأنابيب الخاصة بنماذج النقطة العائمة التي تكون مكلفة.

تتناول دراسة جديدة مفهوم التدريب القائم على الوعي بالكمية (Quantization-Aware Training - QAT) للسياسات المستخدمة في الاستنتاج العددي، حيث تم تطوير نظام مبتكر يعمل على اختيار السياسات ذات عدد البتات المنخفضة وتحويلها إلى وحدات FPGA من نوع Artix-7.

على مدار خمس مهام في إطار MuJoCo، أثبتت الشبكات العصبية التي تم الحصول عليها قدرتها التنافسية مع السياسات ذات الدقة الكاملة (FP32) مع استخدام أقل من 3 أو حتى 2 بت لكل وزن، شريطة اختيار دقة المدخلات بعناية.

عند تنفيذها على الأجهزة المخصصة، حققت هذه السياسات أوقات استنتاج تتراوح في حدود الميكروثواني واستهلاك ميكروجول لكل إجراء، مما يعزز من كفاءتها مقارنة بالأساليب التقليدية المنضبطة.

علاوة على ذلك، أظهرت هذه السياسات الكمية زيادة في قدرتها على مقاومة الضوضاء في المدخلات بالمقارنة مع النموذج القائم على النقطة العائمة، مما يجعلها خيارًا جذابًا لتطبيقات التعلم الآلي في البيئات المتطلبة.

ما رأيكم في هذه التكنولوجيا واستخدامها؟ هل تعتقدون أنها ستكون مستقبل التحكم في الأجهزة الذكية؟ شاركونا آراءكم في التعليقات!