في عالم الذكاء الاصطناعي، أظهرت [التفاعلات](/tag/التفاعلات) مع [نماذج [اللغة](/tag/اللغة) الكبيرة](/tag/[نماذج](/tag/نماذج)-[اللغة](/tag/اللغة)-الكبيرة) (Large Language [Models](/tag/models)) أنه يمكن استخدام [خوارزميات](/tag/خوارزميات) مثل AlphaEvolve وFunSearch لاكتشاف [حلول جديدة](/tag/[حلول](/tag/حلول)-جديدة) بشكل آلي. لكن النجاح في هذا المجال لا يتمثل فقط في قدرات النموذج نفسه، بل يتأثر بشكل كبير بتصميم [البنية التحتية](/tag/البنية-التحتية) للتنفيذ، المعروفة باسم "الهارنس".

استكشفت [الدراسة](/tag/الدراسة) الأخيرة ثلاث مسائل جوهرية تتعلق بتصميم الهارنس:
1. **أي النهجين أنجح؟**: هل من الأفضل إنتاج [عدد](/tag/عدد) كبير من [الخوارزميات](/tag/الخوارزميات) بأفكار سطحية أم القليل منها مع [أفكار](/tag/أفكار) عميقة؟
2. **كيفية التعامل مع طرق [التقييم](/tag/التقييم) الخادعة؟**: كيف يجب أن يعالج الهارنس تلك البرامج التي تستغل وظيفة [التقييم](/tag/التقييم)؟
3. **تنفيذ آمن للوكلاء**: كيف يمكن أن تعمل [الوكلاء](/tag/الوكلاء) الذين يحتاجون إلى الوصول الكامل للنظام بشكل آمن وفعال بالتوازي؟

استخدمت [الدراسة](/tag/الدراسة) إطار [عمل](/tag/عمل) Vesper، والذي يتضمن [تحسينات](/tag/تحسينات) في [تصميم](/tag/تصميم) الهارنس لاستكشاف فعاليته في مجال [اكتشاف](/tag/اكتشاف) الخوارزميات، وخصوصاً في [تحدي](/tag/تحدي) Packing Circle تحت نفس [ميزانية](/tag/ميزانية) الرموز. والنتيجة المثيرة كانت أن إنتاج [عدد](/tag/عدد) أقل من [الخوارزميات](/tag/الخوارزميات) مع [تواصل](/tag/تواصل) أعمق مع كل واحدة منها قاد إلى [تحقيق](/tag/تحقيق) نتائج أعلى.

يعني ذلك أن [تحسين](/tag/تحسين) جودة كل [نموذج](/tag/نموذج) كفيل بتوفير التكاليف أكثر من زيادة [عدد](/tag/عدد) الأجيال التطورية. والأكثر إثارة للدهشة أن [النماذج](/tag/النماذج) الأكثر قدرة أنتجت طرق [تقييم](/tag/تقييم) خادعة بمعدلات أعلى، مما يجعل [اكتشاف](/tag/اكتشاف) هذه الحيل ضرورة متزايدة مع زيادة قدرة [النماذج](/tag/النماذج).