في ظل تزايد استخدام الذكاء الاصطناعي (AI) ونماذج اللغات الضخمة (Large Language Models) في اختبار البرمجيات الآلي، يبرز التحدي الكبير المتمثل في أن السجلات الناتجة غالبًا ما تعاني من مشكلات مثل الخيال الزائد، انتهاكات الامتثال، مخاطر الأمان، وغياب القدرة على الشرح والمصداقية.

قدم البحث الأخير مفهوم 'إطار اختبار آلي مدرك للحكومة' (Governance-Aware Autonomous Testing Framework - GATF) بهدف تعزيز موثوقية وشفافية واستخدام التقنيات الذكية في اختبار البرمجيات. هذا الإطار الجديد يمد دورة حياة الاختبار الآلي بإضافة مراحل مثل التحقق من الحوكمة، تحليل القدرة على الشرح، تقييم المخاطر الاحتمالية، ومراقبة الامتثال، فضلًا عن حوكمة التدقيق.

تم إجراء تجارب باستخدام مجموعات بيانات Defects4J وPROMISE الخاصة بهندسة البرمجيات، وأظهرت النتائج قدرة إطار GATF على تقليل المخاطر المتعلقة بالحوكمة بنسبة تصل إلى 89.6%، مع تحقيق دقة تصل إلى 94.3% في الحوكمة، و96.5% في موثوقية السجلات، و94.2% في دقة الامتثال، و90.8% في الكفاءة التفسيرية.

تدل هذه النتائج على أن أنظمة الاختبار الآلي التي تأخذ في اعتبارها الحوكمة يمكن أن تعزز بشكل كبير من موثوقية وشفافية وأمان التشغيل مقارنة بالأنظمة التقليدية المدعومة بالذكاء الاصطناعي، مما يوفر بيئة آمنة لاختبار البرمجيات.