في عالم البيانات الضخمة، تهدف الانحدارات الرمزية (Symbolic Regression) إلى كشف النقاب عن القوانين العلمية من خلال التحليل الدقيق للبيانات. في الآونة الأخيرة، تم استخدام نماذج اللغات الكبيرة (Large Language Models) لتوجيه عمليات التعديل المستندة إلى نصوص خلفية، مما يجعلها أكثر توجيهاً مقارنةً بالبرمجة الوراثية العشوائية. ومع ذلك، تتطلب استعادة الرموز بدقة توجيهاً سيمانياً (Semantic Guidance) وهيكلاً واضحاً، ليتم تنفيذ البحث المستند إلى المعرفة من خلال تمثيلات رمزية صحيحة.

للتغلب على القيود الموجودة في الأنظمة الحالية، التي تعاني من عمى هيكلي (Structure-Blindness) وافتقار إلى آليات واضحة لتعديل المحتوى، نطرح إطار عمل مبتكراً يسمى FunctionEvolve. يعتمد هذا الإطار على أشجار التعبير (Expression Trees) لتنظيم كامل عملية البحث. يتم تعزيز التنوع في اختيار الأصول (Parent Selection) بتمثيلات هيكلية ملخصة، بينما تحافظ التعديلات المحلية على التعبيرات الفرعية المفيدة. كما أن تحسين الدرجات المستند إلى الهيكل يعزز دقة التقييم ويقلل من المخاطر الناتجة عن ملاءمة المعاملات الهشة.

تستخدم FunctionEvolve فقط عائلات الدوال الأساسية، دون الحاجة إلى قواعد محددة تتعلق بالمجالات المعينة، مما يعزز إمكانية تعميم النتائج. في تجربة على مجموعة فرعية من 129 مهمة من LLM-SRBench، تمكنت FunctionEvolve مع نموذج Claude Opus 4.6 من استعادة 107 شكل دقيق، محققة نسبة دقة 82.9% عند مرتبة 50، و55.8% عند المرتبة الأولى، متفوقة بشكل كبير على النتائج السابقة.

تظهر تجربة التدقيق أن البحث المرئي الهيكلي هو عنصر أساسي لاستعادة موثوقة، حيث تعتبر تحسينات توجيه LLM وتخصيص المعاملات الهيكلية آليات ضرورية.