في عالم البيانات الضخمة، تهدف الانحدارات الرمزية (Symbolic Regression) إلى كشف النقاب عن القوانين العلمية من خلال التحليل الدقيق للبيانات. في الآونة الأخيرة، تم استخدام نماذج اللغات الكبيرة (Large Language Models) لتوجيه عمليات التعديل المستندة إلى نصوص خلفية، مما يجعلها أكثر توجيهاً مقارنةً بالبرمجة الوراثية العشوائية. ومع ذلك، تتطلب استعادة الرموز بدقة توجيهاً سيمانياً (Semantic Guidance) وهيكلاً واضحاً، ليتم تنفيذ البحث المستند إلى المعرفة من خلال تمثيلات رمزية صحيحة.
للتغلب على القيود الموجودة في الأنظمة الحالية، التي تعاني من عمى هيكلي (Structure-Blindness) وافتقار إلى آليات واضحة لتعديل المحتوى، نطرح إطار عمل مبتكراً يسمى FunctionEvolve. يعتمد هذا الإطار على أشجار التعبير (Expression Trees) لتنظيم كامل عملية البحث. يتم تعزيز التنوع في اختيار الأصول (Parent Selection) بتمثيلات هيكلية ملخصة، بينما تحافظ التعديلات المحلية على التعبيرات الفرعية المفيدة. كما أن تحسين الدرجات المستند إلى الهيكل يعزز دقة التقييم ويقلل من المخاطر الناتجة عن ملاءمة المعاملات الهشة.
تستخدم FunctionEvolve فقط عائلات الدوال الأساسية، دون الحاجة إلى قواعد محددة تتعلق بالمجالات المعينة، مما يعزز إمكانية تعميم النتائج. في تجربة على مجموعة فرعية من 129 مهمة من LLM-SRBench، تمكنت FunctionEvolve مع نموذج Claude Opus 4.6 من استعادة 107 شكل دقيق، محققة نسبة دقة 82.9% عند مرتبة 50، و55.8% عند المرتبة الأولى، متفوقة بشكل كبير على النتائج السابقة.
تظهر تجربة التدقيق أن البحث المرئي الهيكلي هو عنصر أساسي لاستعادة موثوقة، حيث تعتبر تحسينات توجيه LLM وتخصيص المعاملات الهيكلية آليات ضرورية.
اكتشاف القوانين العلمية بذكاء: كيف تغيّر FunctionEvolve قواعد لعبة الانحدار الرمزي؟
تقدم FunctionEvolve إطاراً ثورياً في مجال الانحدار الرمزي، مستخدماً نماذج اللغات الكبيرة (LLMs) لتوجيه البحث نحو النتائج العلمية الدقيقة. مع تحسينات هيكلية جديدة، يصبح من الممكن استعادة القوانين العلمية بدقة متناهية.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
