في ظل التقدم السريع لتقنيات الذكاء الاصطناعي، ومع الاستخدام المتزايد للمساعدات البرمجية المدعومة بنماذج اللغة الفائقة (Large Language Models)، أصبح من الواضح أن الأكواد البرمجية في الصناعة أصبحت مزيجًا متكاملًا من الأكواد التي كتبها البشر وتلك التي أنشأها الذكاء الاصطناعي. لذا، كان من الضروري تعزيز القدرة على كشف مواقع الأكواد المولدة بواسطة الذكاء الاصطناعي بدقة عالية، مما يُسهم في إدارة المخاطر وتحليل الإنتاجية.

ولتحقيق هذا الهدف، تم تقديم معيار جديد يحمل اسم HybridCodeAuthorship، وهو معيار يتضمن مجموعة بيانات مخصصة تحتوي على أكواد بايثون (Python) تتضمن خطوطًا كتبها كل من الإنسان والذكاء الاصطناعي، مما يحاكي الاستخدام الواقعي للمساعدين البرمجيين الذكيين.

تعتمد عملية بناء هذه المجموعة على CodeSearchNet، وهو تجميع ضخم من الروابط للمشاريع مفتوحة المصدر المتواجدة على GitHub. وعلى هذا النحو، تم تقييم أداء خوارزميات حديثة لكشف الأكواد المولدة بواسطة الذكاء الاصطناعي على مستويين: مستوى السطر ومجموعة الأكواد.

أظهرت النتائج التجريبية أن معيار HybridCodeAuthorship يمثل تحديًا كبيرًا، حيث حصلت الخوارزمية الأفضل أداءً، AIGCode Detector، على أعلى درجة F1 بلغت 0.48 في مهام الكشف عن مجموعات الأكواد، و0.56 في الكشف على مستوى السطر.

هذا المعيار ليس مجرد خطوة تقنية جديدة، بل يمثل تفهمًا عميقًا لطبيعة الأكواد المستخدمة في الصناعة، مما يسهل على المطورين والمحللين التعامل مع الأكواد بطريقة فعالة. فهل أنتم مستعدون للتفاعل مع هذه التطورات؟ شاركونا آراءكم في التعليقات!