تعتبر عملية استعادة الشيفرة المصدرية (Decompilation) من الملفات الثنائية الناتجة عن البرامج المجمعة إحدى الخطوات الحاسمة في مجالات تحليل الأمان، هندسة عكس البرمجيات الضارة، وصيانة البرمجيات القديمة. ومع ذلك، فإن المحولات الحالية غالبًا ما تنتج شيفاتٍ لا يمكن تجميعها أو تنفيذها بشكل صحيح، مما يحد من فائدة استخدامها العملي.
في هذا السياق، نقدم إطار عمل متعدد الوكلاء يهدف إلى تحويل الشيفات المستعادة إلى شيفات مصدرية قابلة للتنفيذ من خلال تقنية تسمى إعادة التجميع المدعومة بالقيود المتعددة المستويات (Multi-level Constraint-Guided Decompilation - MCGD). يعتمد نهجنا على خط أنابيب للتحقق الهرمي يتضمن ثلاثة مستويات من القيود:
1. **التحقق النحوي**: من خلال التحليل اللغوي.
2. **التحقق من إمكانية التجميع**: عن طريق استخدام مترجم GCC.
3. **التحقق من التوافق السلوكي**: باستخدام حالات اختبار تم إنشاؤها بواسطة نماذج لغات ضخمة (Large Language Models).
عندما يفشل التحقق، يتم تحسين الشيفات باستخدام وكلاء نموذج لغوي متخصصة تقوم بتنقيح الشيفات بناءً على تعليقات الأخطاء المهيكلة.
قمنا بتقييم إطار العمل الخاص بنا على 1,641 ملف ثنائي حقيقي من ExeBench عبر ثلاثة محولات (RetDec، Ghidra، وAngr). وقد أظهر إطار العمل نجاحًا يتراوح بين 84% إلى 97% من الشيفات القابلة للتنفيذ، محققًا تحسنًا بواقع 28-89 نقطة مئوية عن نتائج المحولات الأساسية.
عند مقارنتها بأحدث الأساليب القائمة على نماذج لغات ضخمة، كان نهجنا (84.1%) يتفوق على LLM4Decompile (80.3%)، وSK2Decompile (73.9%)، وSALT4Decompile (61.8%). وكشفت دراسة تقليم المكونات لدينا عن أهمية التحقق المستند إلى التنفيذ، حيث أن الأساليب التي تعتمد فقط على التجميع حققت دقة سلوكية بنسبة 0% رغم معدلات التجميع العالية التي بلغت 91% - 99%. يحقق النظام التوافق بكفاءة، حيث تصل أكثر من 90% من الملفات الثنائية إلى الدقة خلال دورتين بمتوسط تكلفة يتراوح بين 0.03 إلى 0.05 دولار لكل ملف ثنائي.
تظهر نتائجنا أن تحسين代理 refinement المدعوم بالقيود يمكن أن يعبّر الفجوة بين ناتج المحولات الأولي والشيفات المصدرية التي يمكن استخدامها بشكل عملي.
استعادة الشيفرة المصدرية: تقنية جديدة لتحسين أداء محولات الشيفرات في عالم الذكاء الاصطناعي
تقدم تقنية جديدة تعتمد على نهج متعدد الوكلاء لاستعادة الشيفرة المصدرية من الملفات الثنائية، مما يعزز الدقة والفعالية. هذه الطريقة تمكّن من تحويل النتائج الأولية إلى شيفات قابلة للتنفيذ مع معدل نجاح مرتفع.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
