في عالم يتطلب مواكبة مستمرة وفعالية قصوى، تبرز أهمية جدولة المستخدمين المتعددين في الوقت الفعلي ضمن تطبيقات مثل الذكاء الاصطناعي المدمج (Embodied AI)، الرسائل الفورية، والبث المباشر. يتعين على الجداول أن تتخذ قرارات دقيقة لضمان تلبية قيود الزمن والموارد دون المعرفة المسبقة بحالة النظام، والتي غالبًا ما تكون متغيرة وصعبة التقدير.
ومع ذلك، تواجه الطرق الحالية المستخدمة في التعلم الذاتي العديد من التحديات، إذ تعتمد غالبًا على التفاعل المباشر مع النظم أثناء مراحل التدريب، مما قد يؤثر سلبًا على أداء النظام ويزيد من تكاليف الخدمة.
لذلك، ابتكر الباحثون خوارزمية جديدة تدعى جدولة التعلم غير المتصل مع إرشادات ناقدة ونموذج انتشار (Scheduling By Offline Learning with Critic Guidance and Diffusion Model - SOCD). تعمل هذه الخوارزمية على التعلم من البيانات المجمعة مسبقًا بشكل فعال. تتميز SOCD بتوظيف سياسة انتشار مبتكرة، مدعومة بشبكة ناقد خالية من العينة لتوجيه السلوك.
تُدمج فوائد تحسين المولّد Lagrangian في التعلم المعزز غير المتصل، مما يتيح للخوارزمية تعلم سياسات عالية الجودة وذات وعي بالقيود من مجموعات البيانات المتاحة فقط.
أظهرت النتائج التجريبية أن SOCD مقاومة لمختلف ديناميكيات النظام، سواء كانت جزئية المراقبة أو في بيئات كبيرة النطاق، مما يوفر أداءً متفوقًا مقارنة بالأساليب الحالية.
إذا كنت مهتمًا بكيفية تأثر مجالات مثل الذكاء الاصطناعي وإدارة البيانات بهذه الخوارزمية الجديدة، فلا تتردد في المشاركة برأيك أو استفسارك في التعليقات!
ثورة التعلم الآلي: خوارزمية جديدة لتخصيص الموارد في الوقت الفعلي بدون الاتصال بالإنترنت!
قدمت دراسة جديدة خوارزمية مبتكرة تدعى SOCD، والتي تنطلق من البيانات المتاحة لتخصيص الموارد بشكل فعال في التطبيقات التي تتطلب قيود زمنية. خوارزمية SOCD تُظهر أداءً متفوقًا في ظروف ديناميكية متنوعة.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
