في عالم الذكاء الاصطناعي، تُعتبر القدرة على المعالجة المتوازية لنماذج [اللغة](/tag/اللغة) الكبيرة من أبرز الاتجاهات الحديثة التي تُعزز [الأداء](/tag/الأداء). تمتاز [تقنية](/tag/تقنية) [CAPS](/tag/caps) (Cascaded Adaptive Pairwise Selection) بأنها تجلب تحولاً جذرياً في كيفية [تصنيف](/tag/تصنيف) الحلول أثناء اختبار الأداء، حيث تعتمد على [نموذج](/tag/نموذج) معدّل لاختيار الحلول بشكل أكثر [كفاءة](/tag/كفاءة).

هذه [التقنية](/tag/التقنية) الجديدة، التي تم الإعلان عنها في [منصة](/tag/منصة) arXiv، تتجاوز الطرق التقليدية باعتماد نظام [تقييم](/tag/تقييم) غير متجانس يقوم بتخصيص الموارد على محورين أساسيين: محور الأدلة، الذي يتحكم في مدى [معلومات](/tag/معلومات) الحكم عن كل حل مرشح، ومحور التوزيع، الذي يُكيف كيفية انتشار المقارنات بين الحلول. هذا يسمح بتقليل التكلفة المرتبطة بعمليات [التقييم](/tag/التقييم) بشكل ملحوظ، حيث تُخفض التكاليف إلى النصف تقريبًا مقارنة بالأساليب السابقة.

عند تطبيق [CAPS](/tag/caps) على أربع [نماذج](/tag/نماذج) ذاتية [التحقق](/tag/التحقق) (مثل Qwen3-14B وGPT-OSS-20B) وخمسة [اختبارات](/tag/اختبارات) في مجالات [البرمجة](/tag/البرمجة) والرياضيات، أظهرت النتائج تفوقًا واضحًا على [أساليب](/tag/أساليب) [التحقق](/tag/التحقق) التقليدية في 14 من 20 مجموعة اختبار. كانت النتيجة مثيرة بشكل خاص، حيث تم استخدام 25.4% فقط من [ميزانية](/tag/ميزانية) [التحقق](/tag/التحقق) اللازمة لمشكلات [البرمجة](/tag/البرمجة).

يقدم [هذا العمل](/tag/هذا-العمل) إطارًا مفيدًا للباحثين والمطورين الراغبين في [تحسين](/tag/تحسين) [دقة](/tag/دقة) وكفاءة نماذجهم اللغوية الكبيرة. إنها خطوة كبيرة [نحو](/tag/نحو) [تحقيق](/tag/تحقيق) [تحقيق](/tag/تحقيق) أقصى الاستفادة من الموارد المتاحة دون التضحية بالجودة أو [الدقة](/tag/الدقة).

ما رأيكم في هذه [التقنية](/tag/التقنية) الجديدة؟ شاركونا في [التعليقات](/tag/التعليقات)!