في دراسة جديدة مثيرة، قام فريق من الباحثين بإجراء تجربة محكومة لاختبار 12 بنية متعددة الوكلاء في مجال تصميم البرمجيات باستخدام نماذج لغوية ضخمة (Large Language Models - LLM). باستخدام تصميم تجريبي معقد قائم على 8 مهام تصميمية مختلفة، تم تنفيذ 520 تجربة متنوعة تمثل مجموعة شاملة من التحديات.

وفي ضوء النتائج، تمكن الباحثون من تحديد أربعة نتائج رئيسية:

1. **التصميم الهيكلي المنافس (v4b)** جاء على رأس الترتيب بمعدل 4.637 من 5.0، وهو نموذج يتطلب إعادة كتابة شاملة بدلاً من تصحيحات بسيطة، مما يعكس تأثير الابتكار في تصميم البرمجيات.

2. **مراجعة نماذج متعددة** (cross-model review) احتلت المركز الثاني، حيث يتضمن هذا الأسلوب استخدام نموذج لجيل النصوص وآخر لمراجعتها، وحصل على تصنيف متوازن من جميع المقيمين بمعدل 4.606.

3. **تنوع المقيمين** يُظهر اختلافات ملحوظة، حيث اتفق المقيمون الثلاثة على أن النموذج (v4b) هو الأفضل، ولكن تباينت آراؤهم بشأن النموذج (v2b) ما يعكس كيفية وزن جودة التصميم عبر عائلات النماذج المختلفة.

4. **دمج متوازي** باء بالفشل، حيث صنف جميع المقيمين نماذج الدمج ضمن المجموعة الأدنى، بسبب مشاكل مثل نقص التوكن والتأثير المتنوع.

تعتبر هذه الدراسة شاهداً على القدرة المتزايدة لنماذج الذكاء الاصطناعي في دعم عمليات التصميم المعقدة، مما يفتح آفاق جديدة لمشاريع البرمجيات المستقبلية. هل تعتقد أن الذكاء الاصطناعي يمكن أن يلعب دوراً أكبر في التصميم البرمجي؟ شاركونا آراءكم في التعليقات.