في عالم الذكاء الاصطناعي، يواجه العلماء والباحثون تحديات كبيرة في بناء سياسات اتخاذ قرارات يمكن أن تتوسع وتُستخدم بسهولة من خلال بيانات سابقة. هذه المهمة تأخذ وقتًا وجهدًا كبيرين نظرًا لقيود الأساليب التقليدية التي تعتمد على تنسيقات ثابتة للملاحظات والمساحات. وفي المقابل، تقدم نماذج اللغات الضخمة (Large Language Models) واجهة نمذجة مرنة يمكنها استيعاب الملاحظات والإجراءات المتنوعة بسلاسة.
استجابة لهذه التحديات، تم تقديم نموذج القرار الموحد (DLM) الذي يعيد صياغة عملية صنع القرار الجماعي كمسألة تنبؤ تسلسلي بأسلوب الحوار. يتم تدريب هذا النموذج في مرحلتين: الأولى هي مرحلة التعديل المفصل تحت إشراف، حيث يتم استخدام مجموعات بيانات بأسلوب الحوار لتدريب مركزي يشمل سياق بين الوكلاء، بينما ينتج عن هذا التدريب إجراءات قابلة للتنفيذ من مسارات سابقة.
المرحلة الثانية تشمل تحسين السياسات النسبية بين المجموعات، لتعزيز القدرة على التعامل مع الإجراءات غير المعروفة من خلال استخدام دوال مكافآت خفيفة.
تُظهر النتائج التجريبية عند اختبار النموذج على مجموعة متنوعة من المعايير أن DLM متفوق على الأساليب التقليدية القوية في التعلم المعزز عبر الوكلاء (MARL) وكذلك على طرق اتخاذ القرارات المرتبطة بالنماذج اللغوية. علاوة على ذلك، يُظهر النموذج قدرة قوية على التعميم الفوري (Zero-shot Generalization) تجاه سيناريوهات لم يسبق له التصدي لها، مما يوفر آفاقًا جديدة لتطبيقات الذكاء الاصطناعي المتعددة.
ما رأيكم في هذه الابتكارات الجديدة في مجال الذكاء الاصطناعي؟ هل ترون لها تطبيقات في حياتكم اليومية أو مجال عملكم؟ شاركونا في التعليقات!
نموذج القرار الموحد: ثورة في اتخاذ القرارات الجماعية بذكاء اصطناعي متقدم!
يعكف الباحثون على تطوير نموذج القرار الموحد (DLM) الذي يهدف إلى تحسين عملية اتخاذ القرارات بين عدة وكلاء بطريقة مبتكرة. يتجاوز هذا النموذج القيود التقليدية ويوفر قدرة على التعميم في سيناريوهات جديدة.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
