في عالم الذكاء الاصطناعي، يعد التلوث البياني من التحديات البارزة التي تهدد موثوقية تقييم النماذج. والآن، مع ظهور نماذج اللغات الضخمة (LLMs) مثل GPT-5، أصبح تلوث الكود أمرًا يتطلب المزيد من التركيز والدراسة.

يأتي الإطار الجديد TRACER كحل مبتكر لكشف تلوث الكود بدقة عالية، حيث يقدم منهجية متعددة المستويات لفهم التلوث بعمق أكبر. يعتمد TRACER على ثلاثة مستويات من التشابه الدلالي:
1. **وظائف متطابقة** (Functionally Identical)
2. **وظائف شبه متطابقة** (Nearly Identical)
3. **منطق مشترك** (Shared Logic)

يعمل TRACER من خلال عملية انسيابية تبدأ من تقييم خشن وتأخذك إلى تفاصيل دقيقة، مما يمنح المبرمجين القدرة على اكتشاف التلوث بكفاءة أعلى.

بالإضافة إلى ذلك، تم تقديم أول معيار شامل لكشف تلوث الكود بدقة، والذي يشمل ثلاثة معايير شائعة وثلاث مجموعات بيانات تمثيلية بعد التدريب.

لقد أظهر TRACER أداءً قويًا وثابتًا عبر عدة نماذج لغوية، إذ تمكن نموذج GPT-5 من تحقيق درجة F1 تقدر بـ 0.91 في الكشف الدقيق، فيما حقق 0.92 عند الإعداد الثنائي، متفوقًا على الأساليب الحالية بنسبة تتراوح بين 42٪ إلى 217٪.

قام الباحثون أيضًا بإجراء دراسات تحليلية لدراسة تأثير المكونات الفردية ضمن TRACER، مما يفتح آفاقًا جديدة لفهم كيفية تحسين عمليات الكشف عن تلوث الكود.

يبدو أن TRACER يمثل خطوة هامة نحو تطوير أدوات أكثر قوة في مجال البرمجة المدعومة بالذكاء الاصطناعي، مما يجعل أدوات تطوير البرمجيات أكثر موثوقية وأمانًا.

ما رأيكم في هذا الابتكار؟ هل تعتقدون أن TRACER سيساهم في تحسين جودة البرمجيات بشكل ملحوظ؟ شاركونا آراءكم في التعليقات!