في عصر الطاقة المتجددة (Renewable Energy Sources - RES)، تتزايد التحديات الناتجة عن عدم التوازن في الشبكات الكهربائية وخلل التردد. هذه الحالات تبرز أهمية الخدمات المساعدة مثل الاحتياطي الترددي (Frequency Containment Reserve - FCR) والتوازن السلبي. تعمل أنظمة تخزين الطاقة بالبطاريات (Battery Energy Storage Systems - BESS) كحل مثالي لهذه المشاكل، لكنها غالبًا ما تستخدم في أبحاث سابقة عروض متساوية لـ FCR عبر فترة التحكم. هذه العروض الثابتة تعيق الاستفادة الكاملة من مرونة BESS، حيث لا تُوازن بين الاحتفاظ بالطاقة للاحتياطي واستخدامها للتجارة في عدم التوازن.

لذا، نقترح إطار عمل ثنائي المراحل مصمم للسياق الأوروبي، يتضمن عروض FCR غير متساوية. في المرحلة الأولى، نشتق تسلسل عروض متغير حسب الوقت باستخدام تحسين مونت كارلو المدفوع بالبيانات. أما في المرحلة الثانية، استخدم وكيل التعلم المعزز العميق (Deep Reinforcement Learning - DRL) المرونة المتبقية للتجارة في عدم التوازن في الوقت الحقيقي مع إدارة حالة الطاقة (State of Energy - SoE) لضمان الامتثال لمتطلبات FCR.

يعرض هذا الإطار كمفهوم لإثبات الفكرة، مبرزًا الفوائد المحتملة لاستراتيجيات العروض المتغيرة حسب الوقت. من خلال دمج ميزانيات الدورات اليومية والتزامات الاحتياطي المتغيرة، تحقق طريقتنا زيادة بنسبة 7.56% في الأرباح مقارنة بالأسس الثابتة. هذه النتائج توضح أن العروض غير المتساوية يمكن أن تفتح قيمة إضافية من خلال مواءمة أفضل للالتزامات الاحتياطية مع الفرص المتغيرة بسرعة في حالة عدم التوازن.