مع تزايد الاعتماد على نماذج اللغات الضخمة (LLMs) في معالجة البيانات، يبرز البحث الجديد الذي يسلط الضوء على طريقة مثيرة لتحسين عملية اتخاذ القرار بين عدة وكلاء. يعتمد هذا النظام على مفهوم "الميزانية المخصصة لقرار التنفيذ أو الت defer"، حيث يتوجب على النظام تحديد ما إذا كانت الإجابة الحالية موثوقة بما فيه الكفاية لتنفيذها، أو إذا كان ينبغي إحالتها إلى مراجعة بشرية.
تتم العملية من خلال رسم خريطة للنقاش القائم بين الوكلاء إلى حالة منخفضة الأبعاد، وحساب حد أدنى من الثقة للخطأ المحتمل باستخدام بيانات المعايرة. يُسمح بالتنفيذ فقط عندما يتجاوز هذا الحد عتبة موثوقية يحددها المستخدم. كما تُعتبر الشهادة أداة لضبط القرارات الخاطئة من خلال تفكيكها إلى عوامل مختلفة، مما يسهل المعالجة الدقيقة للمخاطر.
تتطلب مختلف المهام إعداد ميزانيات تختلف بحسب درجة التعقيد، ويتم تقييم الأمان من خلال استخدام الميزانية المُعلن عنها مسبقًا. عند إجراء الاختبارات، يمكن للنظام أن يحتفظ بنسبة كبيرة من الميزانية المخصصة، مع تحقيق دقة تصل إلى 96%، مما يعد علامة بارزة في مجال الذكاء الاصطناعي. وفي الحالات الحرجة، يفضل النظام الطرح بدلاً من فرض قرارات ذات موثوقية منخفضة، مما يضع أولويات واضحة لتعزيز الأمان في عمليات الذكاء الاصطناعي.
هذه التقنية تعد بمثابة خطوة هامة نحو استخدامات أكثر أماناً وفاعلية للذكاء الاصطناعي، حيث تفتح الباب لإمكانيات جديدة في كيفية التعامل مع القرارات الحساسة.
إجراء تأثيري: كيف يمكن لنماذج المعالجة اللغوية متعددة الوكلاء تحسين دقة القرارات من خلال حدود موثوقية محلية؟
يكشف البحث الجديد عن كيفية تحسين عملية اتخاذ القرار بين نماذج اللغات الضخمة (LLMs) من خلال تقنية جديدة تعزز دقة الإجابات. هذه الطريقة تتيح للأنظمة تحديد متى يجب اتخاذا القرار ومتى يستوجب تقديمه للمراجعة البشرية.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
