تُعتبر بروتوكولات الإجماع حجر الزاوية في الأنظمة الموزعة وبلوكشين، إذ يمكن أن تؤدي الأخطاء فيها إلى تلف البيانات وخسائر مالية فادحة. وفي حين تُظهر الطُرق المعتمدة على نماذج اللغات الضخمة (Large Language Models) وعودًا كبيرة في تحليل الشفرات، فإنها تواجه تحديات عند التعامل مع الأخطاء المنطقية المعقدة التي تعتمد على حالات متعددة وتنفيذات متغيرة.

هنا يأتي دور أغورا، الإطار المتقدم الذي يجمع بين اختبار فرضيات مدفوعة بفهم المجال وقدرات نماذج اللغات الضخمة للتحقق من البروتوكولات بشكل نظامي. يستخدم أغورا وكلاء متخصصين يعملون معًا لاستكشاف فضاءات الحالة الخاصة بالبروتوكولات، وتجميع سيناريوهات الهجوم باستخدام قيود محددة للمجال، والتحقق من النتائج من خلال تحسينات متكررة.

ما يميز أغورا هو الفصل الواضح للأدوار، مما يتيح منطقًا يمكن من خلاله التفكير في الثوابت العامة للبروتوكول بعكس تحليل الشفرات لوظيفة واحدة فقط. لقد قمنا بتقييم أغورا على أربعة تنفيذات لبروتوكولات الإجماع (Raft, EPaxos, HotStuff, BullShark) باستخدام أربع نماذج لغات ضخمة حديثة. وقد نجح أغورا في اكتشاف 15 خطأ منطقيًّا في البروتوكولات بشكل لم يكن مُكتشفًا من قبل، وهي أخطاء تتعارض مع خصائص الأمان، في حين أن الوكلاء المعتمدين على نماذج اللغات الضخمة الأخرى لم يتمكنوا من الكشف عن أي من هذه الأخطاء.

تؤكد نتائجنا أن التعاون المدفوع بفهم المجال بين الوكلاء المتعددي يلعب دورًا حاسمًا في الكشف عن الأخطاء المنطقية العميقة في البروتوكولات المعقدة. هل تتوقع أن تؤدي هذه الابتكارات في الذكاء الاصطناعي إلى تحسين أمان الأنظمة الموزعة؟ شاركونا آرائكم في التعليقات!