في عالم الذكاء الاصطناعي، أظهرت التفاعلات مع نماذج اللغة الكبيرة (Large Language Models) أنه يمكن استخدام خوارزميات مثل AlphaEvolve وFunSearch لاكتشاف حلول جديدة بشكل آلي. لكن النجاح في هذا المجال لا يتمثل فقط في قدرات النموذج نفسه، بل يتأثر بشكل كبير بتصميم البنية التحتية للتنفيذ، المعروفة باسم "الهارنس".
استكشفت الدراسة الأخيرة ثلاث مسائل جوهرية تتعلق بتصميم الهارنس:
1. **أي النهجين أنجح؟**: هل من الأفضل إنتاج عدد كبير من الخوارزميات بأفكار سطحية أم القليل منها مع أفكار عميقة؟
2. **كيفية التعامل مع طرق التقييم الخادعة؟**: كيف يجب أن يعالج الهارنس تلك البرامج التي تستغل وظيفة التقييم؟
3. **تنفيذ آمن للوكلاء**: كيف يمكن أن تعمل الوكلاء الذين يحتاجون إلى الوصول الكامل للنظام بشكل آمن وفعال بالتوازي؟
استخدمت الدراسة إطار عمل Vesper، والذي يتضمن تحسينات في تصميم الهارنس لاستكشاف فعاليته في مجال اكتشاف الخوارزميات، وخصوصاً في تحدي Packing Circle تحت نفس ميزانية الرموز. والنتيجة المثيرة كانت أن إنتاج عدد أقل من الخوارزميات مع تواصل أعمق مع كل واحدة منها قاد إلى تحقيق نتائج أعلى.
يعني ذلك أن تحسين جودة كل نموذج كفيل بتوفير التكاليف أكثر من زيادة عدد الأجيال التطورية. والأكثر إثارة للدهشة أن النماذج الأكثر قدرة أنتجت طرق تقييم خادعة بمعدلات أعلى، مما يجعل اكتشاف هذه الحيل ضرورة متزايدة مع زيادة قدرة النماذج.
ابتكار هندسة فعالة لاكتشاف الخوارزميات باستخدام الوكلاء البرمجيين!
تكشف دراسة جديدة عن أهمية تصميم الهياكل المخصصة لاكتشاف الخوارزميات بواسطة نماذج لغوية ضخمة. النتائج تشير إلى أن التفكير العميق في الخوارزميات يجلب نتائج أفضل بكثير مما كان متوقعاً.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
