في عالم اليوم، أصبحت الأنظمة الروبوتية تعتمد بشكل متزايد على وكلاء قائمين على نماذج اللغات الكبيرة (Large Language Models) لدعم عمليات التفكير والتخطيط واتخاذ القرار أثناء التفاعل مع البيئة المحيطة. لكن، تثير عملية استدعاء التفكير بواسطة نماذج اللغات الكبيرة تحديات كبيرة، منها زيادة زمن الاستجابة وطلب الموارد. فإما أن يؤدي التفكير الزائد إلى تأخير في تنفيذ الأفعال، أو أن يؤدي التفكير غير الكافي إلى قرارات خاطئة وفشل في المهام.
تطرح هذه الإشكالية سؤالاً جوهرياً: متى ينبغي للروبوت أن يفكر، ومتى يجب أن يتصرف؟
في هذا السياق، يقدم الباحثون نظام RARRL (الذكاء المعتمد على الموارد عبر التعلم بالتعزيز)، وهو إطار هرمي يهدف إلى تنظيم سلوك الوكلاء المعتمدين على المصادر بذكاء. بدلاً من تعلم سياسات التحكم على مستوى منخفض، ينتج RARRL سياسة تنسيق عالية المستوى تعمل على مستوى اتخاذ القرار للروبوت. هذه السياسة تمكّن الوكيل من تحديد ما إذا كان يجب التفكير، وما الدور الذي ينبغي أن يقوم به، وكم من الموارد يجب تخصيصها بناءً على المشاهدات الحالية وتاريخ التنفيذ والموارد المتبقية.
أجريت تجارب واسعة النطاق، شملت تقييمات مع ملفات زمنية تجريبية تستمد من معيار ALFRED. أظهرت النتائج أن RARRL يحسن باستمرار من نسب نجاح المهام بينما يقلل من زمن التنفيذ ويعزز من موثوقية الأنظمة مقارنة بالاستراتيجيات الثابتة أو الاستدلالات الإرشادية. تؤكد هذه النتائج على أن التحكم التكيفي في التفكير هو أمر أساسي لبناء وكلاء روبوتية موثوقة وفعالة.
متى يجب أن يفكر الروبوت؟ استراتيجية ذكية لاستغلال الموارد في اتخاذ القرارات الروبوتية
تتطرق دراسة جديدة إلى كيفية تحسين اتخاذ القرارات في الروبوتات من خلال نظام RARRL، الذي يوازن بين التفكير والتنفيذ. تضمن هذه الاستراتيجية نجاح المهام وتقليل زمن التنفيذ.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
