في عصر [الذكاء الاصطناعي](/tag/الذكاء-الاصطناعي) ([Artificial Intelligence](/tag/artificial-intelligence)) المتقدم، ظهر [التعلم المعزز](/tag/[التعلم](/tag/التعلم)-المعزز) العميق (Deep [Reinforcement Learning](/tag/reinforcement-learning) - DRL) كأحد الطرق الواعدة لحل المشاكل المعقدة المتعلقة بجدولة الأعمال، مثل [جدولة](/tag/جدولة) ورش العمل. لكن، ما يعاني منه هذا المجال هو أن [السياسات](/tag/السياسات) التي تعلمها DRL غالباً ما يتم تمثيلها بواسطة [الشبكات العصبية العميقة](/tag/[الشبكات](/tag/الشبكات)-العصبية-العميقة) (Deep [Neural Networks](/tag/neural-networks) - DNNs)، التي تمتاز بهياكلها الغامضة وقراراتها غير القابلة للتفسير. هذا الأمر قد يؤدي إلى قضايا [ثقة](/tag/ثقة) واستخدام خطيرة بالنسبة لمتخذّي القرار البشر.
لذا، تقدم [الدراسة](/tag/الدراسة) الجديدة ProRL، وهو إطار [عمل](/tag/عمل) للتعلم المعزز القابل للتفسير، يتيح [جدولة](/tag/جدولة) ذات [أداء عالي](/tag/[أداء](/tag/أداء)-عالي) باستخدام [سياسات](/tag/سياسات) برمجية يمكن للبشر فهمها وتعديلها بسهولة. تمثل هذه [السياسات](/tag/السياسات) [عبر](/tag/عبر) [لغة](/tag/لغة) مخصصة للجدولة (Domain-Specific Language - DSL-S)، والتي تنظم [استراتيجيات](/tag/استراتيجيات) الجدولة كبرامج هيكلية.
يعمل ProRL عن طريق [استكشاف](/tag/استكشاف) [فضاء](/tag/فضاء) البرامج الذي تحدده DSL-S باستخدام [البحث](/tag/البحث) المحلي لتحديد البرامج غير المكتملة، والتي يكملها برمجياً [عبر](/tag/عبر) [تعلم](/tag/تعلم) معالمها بواسطة [تحسين بايزي](/tag/[تحسين](/tag/تحسين)-[بايزي](/tag/بايزي)). تجدر الإشارة إلى أن ProRL لا يتعلم فقط أي قواعد heuristics لتطبيقها، بل يدمج أيضاً القواعد الموجودة مسبقاً في السيناريوهات الصناعية.
أثبتت [التجارب](/tag/التجارب) على مجموعة واسعة من [النماذج](/tag/النماذج) المرجعية أن ProRL يقدم أداءً قوياً مقارنةً بالقواعد heuristics الحالية ومعايير DRL. كما أن ProRL يتمتع بأداء جيد حتى في بيئات ذات [موارد](/tag/موارد) محدودة، حيث يمكنه أن يتدرب باستخدام 100 حلقة فقط.
في ظل هذه التحديات، يوفر ProRL ثورة في كيفية التعامل مع [جدولة](/tag/جدولة) الأعمال، مما يمهد الطريق لمزيد من [الابتكارات](/tag/الابتكارات) في عالم [الذكاء الاصطناعي](/tag/الذكاء-الاصطناعي). يمكنك الإطلاع على [الشيفرة البرمجية](/tag/الشيفرة-البرمجية) الخاصة بـ ProRL [عبر](/tag/عبر) [الرابط هنا](https://github.com/HcPlu/ProRL). ما رأيكم في هذا التطور المثير؟ شاركونا في [التعليقات](/tag/التعليقات).
إطار عمل جديد للتعلم المعزز: جدولة ذكية وشفافة لنماذج برمجية
تقدم الدراسة الجديدة ProRL، إطار عمل مبتكر للتعلم المعزز القابل للتفسير، مما يسهل جدولة الأعمال بأساليب يمكن للبشر فهمها وتعديلها. التركيز على استخدام لغات برمجية مخصصة يعزز الأداء في بيئات ذات موارد محدودة.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
