تعتبر صياغة متطلبات النظام بشكل رسمي خطوة أساسية للتحقق من الأنظمة متعددة الوكلاء (MAS). ومع ذلك، يعتبر كتابة مواصفات دقيقة مهمة شاقة ومعرضة للأخطاء وتحتاج إلى خبرة عميقة. في هذا السياق، حيث يجب أن تتمكن المتطلبات من التقاط القدرات الاستراتيجية والأهداف الزمنية، لم تكن هناك منهجية معترف بها لاستنتاج مواصفات MAS من اللغة الطبيعية.
لذا، تم تقديم إطار عمل مبتكر لترجمة أوصاف المتطلبات الاستراتيجية المكتوبة باللغة الطبيعية إلى صيغ ATL/ATL* مصاغة بشكل جيد باستخدام نماذج اللغات الضخمة (LLMs). نظرًا لعدم وجود مجموعة بيانات داعمة لتعلم المشرف للترجمة من اللغة الطبيعية إلى ATL/ATL*، قامت الدراسة بإنشاء مجموعة بيانات جديدة تم التحقق منها بواسطة خبراء، تُستخدم لتدريب وتقييم نماذج معدلة.
في مجموعة الاختبار المحجوزة، والتي تم تقييمها بناءً على القضاة من نماذج LLM التي تتفق بشكل أفضل مع التقييمات الخبيرة، تمكّن التحسين داخل المجال للنماذج الصغيرة ذات الأوزان المفتوحة (من 3 إلى 7 مليار معلمة) من تحقيق نتائج متساوية مع نماذج واجهات برمجة التطبيقات الاحتكارية القوية.
وصل أفضل نظام تم تحسينه لدينا إلى دقة دلالية تبلغ 0.84، وهو قريب إحصائيًا من 0.86 لأقوى نموذج احتكاري، مع الحفاظ على متطلبات العمل داخل المنشأة. كما وجدنا أن موثوقية القضاة تتناسب عكسيًا مع قوة المولد. حيث أن نموذج Llama-3.3-70B ذي الأوزان المفتوحة يتتبع أحكام البشر بشكل أقرب، بينما النماذج الاحتكارية الأقوى كانت أقل موثوقية، حيث ترفض بشدة التعبيرات المختلفة المؤمنة للمراجع.
لتقييم التطبيق العملي للمواصفات الناتجة، تم تضمين أداتنا في نموذج فحص منطقي استراتيجي موجود، مما يمكّن المستخدمين غير الخبراء من تحديد الخصائص الاستراتيجية باللغة الطبيعية.
تحويل اللغة الطبيعية إلى مواصفات استراتيجية زمنية باستخدام نماذج اللغات الضخمة!
يحقق بحث جديد تقدمًا ملحوظًا في تحويل متطلبات الأنظمة متعددة الوكلاء من اللغة الطبيعية إلى مواصفات رسمية. يستخدم البحث نماذج اللغات الضخمة لتحقيق فهم أفضل لمتطلبات الزمن والاستراتيجية.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
