أصبحت نماذج اللغات الضخمة (Large Language Models) من العناصر الأساسية في عملية تطوير البرمجيات، خاصة بعد ظهور القدرات الوكيلة (agentic capabilities) التي تعزز من أدائها. ولكن، تثير العديد من هذه النماذج، المرتبطة بمقدمي خدمات محددين، تساؤلات حول ما إذا كانت التعليمات البرمجية التي تولدها تفضل بيئات مقدميها على البدائل المماثلة، مما قد يُقيّد خيارات المطورين ويزيد من اعتمادهم على مزود واحد.

حدد الباحثون هذا السلوك باسم "تحيز التكامل الرأسي" (Vertical Integration Bias - VIB)، وقدموا معيارًا جديدًا تحت اسم "VIBench" لقياس هذا التحيز في توليد التعليمات البرمجية المباشرة والوكيلة عبر 20 سيناريو من أنظمة البرمجيات القابلة للاختيار من قبل المزود.

في تقييم أجري لمحاكاة 10 نماذج رائدة مرتبطة بمقدمي خدمات ضد 3 نماذج غير مرتبطة، وُجد أن التحليل يظهر وجود تحيز إيجابي في التوليد المباشر، حيث أظهرت ستة من النماذج العشر المتصلة تأثيرات ذات دلالة إحصائية تصل إلى +18.8 نقاط مئوية. كما عززت التدفقات الوكيلة تأثير التحزب الرأسي، ليصل إلى +39.2 نقاط مئوية. وعلاوة على ذلك، فإن الخيارات المرتبطة بالبيئة المرافقة في التدفقات الوكيلة يمكن أن تستمر لتؤثر في الملفات المنفصلة مفهومياً، حيث بلغت نسبة الاستمرارية 90.3%.

تؤكد هذه النتائج على أهمية قياس هذا التحيز في عملية تطوير التعليمات البرمجية، خاصة مع تزايد استخدام القدرات الوكيلة في المستقبل. لذا، كيف يمكن للمطورين حماية خياراتهم في ظل هذه التغيرات السريعة؟