تشهد الأسواق المالية صعوبات كبيرة في التعامل مع الضجيج والبيانات غير المستقرة. هذه المشكلات غالبًا ما تعيق تقنيات التعلم المعزز التقليدي، مثل طريقة "Soft Actor-Critic" (SAC)، مما يؤدي إلى ما يُعرف بفخ "انتروبيا المالية". حيث تتسبب الحالة الضجيجية في تقديرات غير موثوقة لقيم Q، مما يفاقم الأخطاء عبر أساليب الاستناد.
في ورقة بحثية جديدة، قدم الباحثون تقنية مبتكرة تُعرف بـ FPQC-SAC، والتي تُعتبر نسخة مُحسنة من SAC. تدمج هذه التقنية دوائر كمومية معلماتية (Parameterized Quantum Circuits) قبل الشبكات المستخدمة في الممثل والناقد. هذا النهج يعمل على تقييد انتشار الميزات على مستوى التمثيل، بدلاً من تصفية المدخلات الخام أو تنظيم قيم Q بعد عملية الاستناد.
واحدة من أبرز مميزات FPQC-SAC هي تقليل تأثير التقلبات الشديدة في الأسواق على تقدير أهداف بيلمان، في حين تحافظ التشابكات الكمومية القابلة للتدريب على تفاعلات مرنة بين الأصول المختلفة. تمت دراسة أداء_FPQC-SAC_ في مهام إدارة المحافظ المالية الحقيقية، حيث أظهرت النتائج تحسينًا ملحوظًا في استقرار العوائد التراكمية، مع تحقيق زيادة نسبتها 66.89٪ مقارنة بصيغ SAC التقليدية.
هذا الابتكار لا يُعزز فقط فعالية التعلم المعزز في السوق، بل يوفر أيضًا منصة مفتوحة المصدر يمكن للباحثين والممارسين الوصول إليها وتطويرها.
ما رأيكم في هذا التطور؟ شاركونا في التعليقات.
ثورة في التعلم المعزز المالي: كيف تساعد تمثيلات الكم على تقليل التحيز في الأسواق المضطربة؟
تعاني الأسواق المالية من تحديات التداخل بين الضجيج والإشارات، مما يؤثر على دقة التقديرات في طرق التعلم المعزز. تقدم FPQC-SAC، المتكاملة مع الدوائر الكمومية، حلاً مبتكراً لتحسين الاستقرار والعوائد.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
