في عالم [الذكاء الاصطناعي](/tag/الذكاء-الاصطناعي) الناشئ، يمثل [التخطيط](/tag/التخطيط) (Planning) عنصرًا أساسيًا لنماذج [اللغات](/tag/اللغات) الضخمة (Large Language [Models](/tag/models)) حيث يتطلب [أداء المهام](/tag/[أداء](/tag/أداء)-المهام) المركبة [تنسيق](/tag/تنسيق) الأهداف والقيود والموارد والعواقب طويلة المدى في [حلول](/tag/حلول) قابلة للتنفيذ والتحقق. رغم ذلك، غالبًا ما تُعالج [بيانات](/tag/بيانات) [التخطيط](/tag/التخطيط) الحالية كجمعيات ثابتة من الأمثلة بدلاً من أهداف [توليد](/tag/توليد) قابلة للتحكم، مما يحد من تغطية السيناريوهات ويقيد [الصعوبة](/tag/الصعوبة) بوسائط سطحية بدلاً من المصادر الهيكلية.

لتجاوز هذه التحديات، تم تقديم إطار [عمل](/tag/عمل) [جديد](/tag/جديد) يُدعى PlanningBench، الذي يعيد تعريف كيفية [توليد بيانات](/tag/[توليد](/tag/توليد)-[بيانات](/tag/بيانات)) [التخطيط](/tag/التخطيط) بشكل يضمن المزيد من التنوع، ويمكن [التحقق](/tag/التحقق) منه، وقابلة للتوسع، سواء للاختبار أو [التدريب](/tag/التدريب). يعتمد PlanningBench على سيناريوهات [التخطيط](/tag/التخطيط) الحقيقية، ويقوم بتجريد [سير العمل](/tag/سير-العمل) العملي إلى [تصنيف](/tag/تصنيف) منظم يتضمن أكثر من 30 نوعًا من المهام، والمهام الفرعية، وعائلات القيود، وعوامل [الصعوبة](/tag/الصعوبة).

من خلال هذه التصنيفات، يقوم [خط أنابيب](/tag/خط-أنابيب) [ترخيص](/tag/ترخيص) مُدار بالقيود بإنتاج مشكلات تخطيطية مستقلة مع [تحكم](/tag/تحكم) في الصعوبة، وتنقية الجودة، وقوائم [التحقق](/tag/التحقق) للتحقق من الأمثلة. هذا التحول ينقل [بناء](/tag/بناء) [بيانات](/tag/بيانات) [التخطيط](/tag/التخطيط) من تجميع ثابت للمعايير إلى [توليد](/tag/توليد) قابل للتحكم مع الحفاظ على [تجسيد](/tag/تجسيد) واقعي للمهام.

تم استخدام PlanningBench لتقييم [نماذج [اللغات](/tag/اللغات) الضخمة](/tag/[نماذج](/tag/نماذج)-[اللغات](/tag/اللغات)-الضخمة) المتقدمة مفتوحة المصدر والمغلقة، وكشفت النتائج عن استمرار صعوبة [النماذج](/tag/النماذج) الحالية في إنتاج [حلول](/tag/حلول) شاملة تحت [قيود](/tag/قيود) مترابطة. علاوة على ذلك، أشارت التحليلات إلى أن الحلول المحددة أو الموصوفة جيدا توفر [إشارات](/tag/إشارات) [مكافأة](/tag/مكافأة) أكثر وضوحًا وديناميكيات [تدريب](/tag/تدريب) أكثر استقرارًا.

بشكل عام، يُعد PlanningBench مصدراً قابلاً للتحكم لبيانات [التخطيط](/tag/التخطيط)؛ مما يوفر دعماً لتشخيص وتحسين القدرات التخطيطية القابلة للتعميم في [نماذج [اللغات](/tag/اللغات) الضخمة](/tag/[نماذج](/tag/نماذج)-[اللغات](/tag/اللغات)-الضخمة). هذا الإطار الجديد يمثل خطوة مهمة [نحو](/tag/نحو) [تطوير](/tag/تطوير) [ذكاء اصطناعي](/tag/ذكاء-اصطناعي) أقوى وأكثر [كفاءة](/tag/كفاءة).

ما رأيكم في هذا التطور المثير؟ شاركونا في [التعليقات](/tag/التعليقات)!