في ظل التطورات السريعة في مجال الذكاء الاصطناعي، تواجه وكالات الذكاء الاصطناعي تحديات عدة بعد انتهاء فترة التدريب. فقد تعاني هذه الوكالات من بيانات تجارية غامضة ومكاسب غير مؤكدة بعد التدريب ومخاطر تتعلق بالإفراج عن التحديثات. هنا يأتي دور طريقة CLAP (Closed-Loop Agent Post-training)، التي تمثل تحولًا جذريًا في الطريقة التي ندير بها البيانات بعد التدريب.
في البحث الجديد الذي تم نشره، تم تقديم CLAP كطريقة مغلقة تولد عينات منظمة من بيانات الأعمال. تشمل هذه العيّنات تقييمات تفضيل القرار ومجموعات احتياطية وسجلات مخاطر. حيث يجمع CLAP بين طرق تحقق البيانات، وتحليل المقاييس، وتقييم المكافآت، فضلاً عن مراجعة فترات التطبيق، ليقرر ما إذا كانت وكيلاً معينة مناسبة لسلسلة التطبيقات المستهدفة.
أظهرت النتائج المستخلصة من خمس دفعات مجهولة المصدر في سيناريوهات التصنيع أن استخدام أسلوب QLoRA-style LoRA-SFT حقق مكاسب متوسطة، حيث زادت النقاط الكلية بنسبة 0.0098، ومعدل النجاح بنسبة 0.0240، ودقة الأدلة بنسبة 0.0280. ورغم هذه المكاسب، لم تتحسن جميع الدفعات، بل تراجعت بعضها، مما يُظهر المخاطر العالية المرتبطة بتقنية GRPO.
كما أظهر التحليل من خلال مراجعة تطبيقات الصوت أنه من الضروري استخدام RAG لاستخراج الحقائق، إذ أدت عمليات التطوير إلى تحسينات ملحوظة في القيم والمجالات الأساسية ومطابقة الوثائق. ومع ذلك، هناك زيادة في زمن الاستجابة.
تشير هذه النتائج إلى أهمية إدارة وكالات الذكاء الاصطناعي بعد التدريب من خلال دمج دورة متكاملة من البيانات والتدريب والتقييم والإفراج، بعيدًا عن الاعتماد على اكتمال التدريب أو معيار واحد خارجي.
أنت الآن أمام حقبة جديدة في عالم الوكالات الذكية. ما رأيكم في أسلوب CLAP؟ هل تجدونه حلاً مبتكرًا يغير قواعد اللعبة؟ شاركونا آرائكم في التعليقات!
اكتشاف CLAP: ثورة جديدة في تحسين وكالات الذكاء الاصطناعي بعد التدريب!
يقدم أسلوب CLAP طريقة مبتكرة لإدارة وكالات الذكاء الاصطناعي بعد التدريب، مستخدمًا دورة مغلقة لتحويل البيانات إلى عينات محددة. نتائج البحث تشير إلى تحسن ملحوظ في الأداء رغم بعض التحديات.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←# CLAP# الذكاء الاصطناعي# بيانات الأعمال# تحسين الأداء# تدريب# وكالات الذكاء الاصطناعي# نموذج LoRA-SFT
جاري تحميل التفاعلات...
