في عالم [تطوير البرمجيات](/tag/[تطوير](/tag/تطوير)-[البرمجيات](/tag/البرمجيات)) السريع، حيث تسهم [وكالات الذكاء الاصطناعي](/tag/[وكالات](/tag/وكالات)-الذكاء-الاصطناعي) في تغيير طريقة [كتابة](/tag/كتابة) الشيفرة، تبرز الحاجة إلى [معايير](/tag/معايير) دقيقة لتقييم [أداء](/tag/أداء) هذه الوكالات. هنا يأتي دور OmniCode، المعيار الجديد القادر على [تقييم](/tag/تقييم) [وكالات](/tag/وكالات) [تطوير البرمجيات](/tag/[تطوير](/tag/تطوير)-[البرمجيات](/tag/البرمجيات)) بشكل شامل ومتنوع.
يعتمد OmniCode على 1794 مهمة موزعة بين [لغات](/tag/لغات) [برمجة](/tag/برمجة) مرموقة مثل [بايثون](/tag/بايثون) ([Python](/tag/python)) وجافا ([Java](/tag/java)) وC++، ويشمل أربع فئات رئيسية: إصلاح [الأخطاء](/tag/الأخطاء) (bug fixing)، إنشاء الاختبارات (test generation)، [مراجعة الشيفرة](/tag/مراجعة-الشيفرة) وإصلاحات النمط (style fixing). هذا [التنوع](/tag/التنوع) يتجاوز المهام التقليدية التي تركز على مجالات محدودة مثل [البرمجة](/tag/البرمجة) [التنافسية](/tag/التنافسية) (competitive programming) أو [توليد](/tag/توليد) التصحيحات (patch generation).
لقد تم [تصميم](/tag/تصميم) جميع المهام الموجودة في OmniCode بعناية: كل مهمة تم [التحقق](/tag/التحقق) منها يدوياً للتأكد من خلوها من مشاكل غير واضحة، بالإضافة إلى أنها تم تصميمها بعيداً عن [مخاطر](/tag/مخاطر) [تسرب البيانات](/tag/تسرب-[البيانات](/tag/البيانات)). في اختبارها مع [أطر العمل](/tag/أطر-العمل) التابعة لوكالات [البرمجة](/tag/البرمجة) المشهورة مثل [SWE](/tag/swe)-Agent، أظهرت النتائج تفوقاً في بعض المهام، مثل إصلاح [الأخطاء](/tag/الأخطاء) باستخدام بايثون، لكنها تعثرت في مجالات مثل إنشاء الاختبارات وبلغات أخرى مثل C++ وجافا.
على سبيل المثال، مسجل [SWE](/tag/swe)-Agent حقق نتيجة قصوى تبلغ 25.0% في إنشاء الاختبارات بلغة C++ مع [DeepSeek](/tag/deepseek)-V3.1. يهدف OmniCode إلى تقديم معيار قوي يحفز [تطوير](/tag/تطوير) [وكالات](/tag/وكالات) قادرة على [الأداء](/tag/الأداء) الجيد [عبر](/tag/عبر) مختلف جوانب [تطوير البرمجيات](/tag/[تطوير](/tag/تطوير)-[البرمجيات](/tag/البرمجيات)).
يمكنك [معرفة](/tag/معرفة) المزيد عن OmniCode وتحميل [الكود](/tag/الكود) والبيانات من [رابط GitHub]. هل تعتقد أن [تطوير](/tag/تطوير) [معايير جديدة](/tag/[معايير](/tag/معايير)-جديدة) مثل OmniCode سيحدث ثورة في [صناعة البرمجيات](/tag/[صناعة](/tag/صناعة)-[البرمجيات](/tag/البرمجيات))؟ شاركونا آرائكم!
OmniCode: معيار جديد لتقييم وكالات تطوير البرمجيات وتحسين الأداء
تقدم OmniCode معياراً مبتكراً لتقييم وكالات تطوير البرمجيات، كاشفةً عن أهمية تنوع المهام في تحسين أداء هذه الوكالات. يتضمن المعيار 1794 مهمة عبر ثلاث لغات برمجة رئيسية، مما يمثل خطوة قوية نحو تطوير أكثر فعالية.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
