تتطور تدفقات العمل المدعومة بالذكاء الاصطناعي بشكل مذهل، حيث تعتمد بشكل متزايد على حلقات تكرارية من الجيل والتقييم والتعديل. السؤال المحوري الذي يبرز هنا هو: متى نقرر إطلاق النتيجة الحالية؟ يعكس هذا القرار تحدياً إحصائياً معقداً، بسبب عدم توفر النماذج الاحتمالية أو افتراضات القابلية للتبادل التي تُستخدم عادةً لضبط النتائج.
في هذا السياق، نقدم طريقة جديدة تدعى 'غلاف الإطلاق الدائم'، التي تُطبق على أنظمة الجيل والتقييم الحالية. يقوم هذا الغلاف بإنشاء مجموعة مرجعية من الحالات الفاشلة التي حصلت على درجات عالية، مما يتيح لنا ضبط درجات تقييم الوقت الفعلي ضد هذه المجموعة. وبذلك، نجمع الأدلة الناتجة باستخدام عملية تدفق متسقة (e-process).
تتضمن هذه الطريقة دورين مختلفين: حيث تتحول مجموعة المراجع إلى أدلة محافظة تدعم قرار الإطلاق، في حين تقدم العملية الصلاحية ضمن الخيارات المتاحة. نظرياً، نُظهر أن مجموعة مرجعية محافظة تضمن التحكم في احتمال الإطلاق في المهام غير الممكنة، وهي المهام التي لا يمكن للتدفق الحالي إنتاج حل موثوق لها. بالإضافة إلى ذلك، نحدد الظروف التي يمكن فيها أن تحقق نفس القاعدة المحافظة إطلاقاً غير تافه في المهام الممكنة.
في دراسة حالة لوكيل البرمجة MBPP+، تم تقليل عدد عمليات الإطلاق المبكرة غير الصحيحة بشكل ملحوظ مقارنةً بقواعد الإيقاف التقليدية، مع الحفاظ على الإطلاق في المهام التي يجمع فيها التدفق أدلة دعم متوسطة بشكل متكرر. لذا، يمكننا اليوم أن نطرح السؤال: كيف يمكن أن تغير هذه النهج الحديثة في إطلاق الأنظمة الذكية عالم الذكاء الاصطناعي؟
متى يجب إطلاق تدفقات العمل المدعومة بالذكاء الاصطناعي؟ حل دائم للمشكلات من أنظمة الجيل والتحقق
يستعرض هذا المقال منهجية جديدة لتحسين قرارات إطلاق أنظمة الذكاء الاصطناعي عبر إنشاء مجموعة مرجعية موثوقة. هذه الطريقة تضمن نتائج دقيقة حتى في الظروف الصعبة التي تواجه التدفقات غير القابلة للتنبؤ.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
