تهدف الأبحاث المتقدمة في مجال الذكاء الاصطناعي إلى تحسين طرق التحقق من صحة الأنظمة البرمجية، والتي تعتبر عنصرًا أساسيًا لضمان سلامة الأنظمة الحرجة. توضح ورقة بحثية جديدة كيف يمكن دمج التقنيات الحديثة، مثل النماذج اللغوية الضخمة (Large Language Models)، في عمليات التحقق لضمان فعالية أكبر.

تقدم هذه الورقة إطارًا مبتكرًا لتوليد الإثباتات العصبية الرمزية، يهدف إلى أتمتة البحث عن الإثباتات في مشاريع التحقق على مستوى النظام. باستخدام تقنية البحث الشجري، يقوم الإطار بلقاء حالات الإثبات ويطرح أسئلة على النموذج اللغوي الضخم لتحديد خطوات الإثبات التالية.

تقوم الفكرة على تحسين قدرات النماذج اللغوية بالاعتماد على مجموعات بيانات تضم أزواجًا من حالات الإثبات والخطوات، ودمج مجموعة من أدوات إثبات النظرية (Interactive Theorem Proving) لإصلاح الخطوات المرفوضة، وتصنيف حالات الإثبات، والتخلص التلقائي من الأهداف الفرعية عندما يتوقف التقدم.

أثبت النظام فعاليته في تحقيق نسبة إثبات تصل إلى 77.6% من النظريات في مشروع seL4، مما يتجاوز أساليب النماذج اللغوية السابقة ويقدم حلولاً أكثر تعقيدًا للإثباتات المتعددة الخطوات. هذه النتائج تشير إلى إمكانية قوية نحو تحقيق التحقق الآلي القابل للتوسع في البرمجيات، مما يعد بأن المستقبل يحمل لنا مزيدًا من الابتكارات في هذا المجال المتنامي.