في عالم [الذكاء الاصطناعي](/tag/الذكاء-الاصطناعي) الناشئ، يمثل [التخطيط](/tag/التخطيط) (Planning) عنصرًا أساسيًا لنماذج [اللغات](/tag/اللغات) الضخمة (Large Language [Models](/tag/models)) حيث يتطلب [أداء المهام](/tag/[أداء](/tag/أداء)-المهام) المركبة [تنسيق](/tag/تنسيق) الأهداف والقيود والموارد والعواقب طويلة المدى في [حلول](/tag/حلول) قابلة للتنفيذ والتحقق. رغم ذلك، غالبًا ما تُعالج [بيانات](/tag/بيانات) [التخطيط](/tag/التخطيط) الحالية كجمعيات ثابتة من الأمثلة بدلاً من أهداف [توليد](/tag/توليد) قابلة للتحكم، مما يحد من تغطية السيناريوهات ويقيد [الصعوبة](/tag/الصعوبة) بوسائط سطحية بدلاً من المصادر الهيكلية.
لتجاوز هذه التحديات، تم تقديم إطار [عمل](/tag/عمل) [جديد](/tag/جديد) يُدعى PlanningBench، الذي يعيد تعريف كيفية [توليد بيانات](/tag/[توليد](/tag/توليد)-[بيانات](/tag/بيانات)) [التخطيط](/tag/التخطيط) بشكل يضمن المزيد من التنوع، ويمكن [التحقق](/tag/التحقق) منه، وقابلة للتوسع، سواء للاختبار أو [التدريب](/tag/التدريب). يعتمد PlanningBench على سيناريوهات [التخطيط](/tag/التخطيط) الحقيقية، ويقوم بتجريد [سير العمل](/tag/سير-العمل) العملي إلى [تصنيف](/tag/تصنيف) منظم يتضمن أكثر من 30 نوعًا من المهام، والمهام الفرعية، وعائلات القيود، وعوامل [الصعوبة](/tag/الصعوبة).
من خلال هذه التصنيفات، يقوم [خط أنابيب](/tag/خط-أنابيب) [ترخيص](/tag/ترخيص) مُدار بالقيود بإنتاج مشكلات تخطيطية مستقلة مع [تحكم](/tag/تحكم) في الصعوبة، وتنقية الجودة، وقوائم [التحقق](/tag/التحقق) للتحقق من الأمثلة. هذا التحول ينقل [بناء](/tag/بناء) [بيانات](/tag/بيانات) [التخطيط](/tag/التخطيط) من تجميع ثابت للمعايير إلى [توليد](/tag/توليد) قابل للتحكم مع الحفاظ على [تجسيد](/tag/تجسيد) واقعي للمهام.
تم استخدام PlanningBench لتقييم [نماذج [اللغات](/tag/اللغات) الضخمة](/tag/[نماذج](/tag/نماذج)-[اللغات](/tag/اللغات)-الضخمة) المتقدمة مفتوحة المصدر والمغلقة، وكشفت النتائج عن استمرار صعوبة [النماذج](/tag/النماذج) الحالية في إنتاج [حلول](/tag/حلول) شاملة تحت [قيود](/tag/قيود) مترابطة. علاوة على ذلك، أشارت التحليلات إلى أن الحلول المحددة أو الموصوفة جيدا توفر [إشارات](/tag/إشارات) [مكافأة](/tag/مكافأة) أكثر وضوحًا وديناميكيات [تدريب](/tag/تدريب) أكثر استقرارًا.
بشكل عام، يُعد PlanningBench مصدراً قابلاً للتحكم لبيانات [التخطيط](/tag/التخطيط)؛ مما يوفر دعماً لتشخيص وتحسين القدرات التخطيطية القابلة للتعميم في [نماذج [اللغات](/tag/اللغات) الضخمة](/tag/[نماذج](/tag/نماذج)-[اللغات](/tag/اللغات)-الضخمة). هذا الإطار الجديد يمثل خطوة مهمة [نحو](/tag/نحو) [تطوير](/tag/تطوير) [ذكاء اصطناعي](/tag/ذكاء-اصطناعي) أقوى وأكثر [كفاءة](/tag/كفاءة).
ما رأيكم في هذا التطور المثير؟ شاركونا في [التعليقات](/tag/التعليقات)!
تحسين الذكاء الاصطناعي: كيف تعيد PlanningBench تشكيل بيانات التخطيط لتدريب نماذج اللغات الضخمة!
كشف مشروع PlanningBench عن إطار عمل مبتكر لتوليد بيانات التخطيط القابلة للتحقق والتوسع، مما يعزز القدرة على تقييم وتدريب نماذج اللغات الضخمة. حان الوقت لتطوير ذكاء اصطناعي قوي وأكثر كفاءة!
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
