تُعد السجلات الرمزية (Symbolic Regression) واحدة من التحديات الأساسية في مجالات الاكتشاف العلمي، حيث تهدف إلى اكتشاف تعبيرات رياضية تلخص مجموعة معينة من البيانات. بينما كانت الأساليب التقليدية تعتمد بشكل أساسي على الخوارزميات الجينية والتقنيات التطورية، إلا أنها بدأت تواجه تحديات في قابلية التوسع والقدرة على التعبير.
مؤخراً، أظهرت الدراسات أن دمج الأساليب المستندة إلى نماذج اللغة الكبيرة (Large Language Models) في السجلات الرمزية يمكن أن يكون له تأثير إيجابي. ومع ذلك، كانت الطرق الحالية تعتمد عادةً على مقاييس تقييم بسيطة مثل متوسط الخطأ التربيعي، مما ينتج عنه تجاهل المعلومات الغنية الموجودة في البيانات.
للتغلب على هذه القيود، نقدم إطار عمل جديد يعتمد على البحث التطوري باستخدام نماذج اللغة الكبيرة، حيث يتميز بدمج تحسين السياق البرمجي. تتيح هذه التقنية تفاعلات قائمة على الكود مع مجموعة البيانات، مما يمكن النظام من إجراء تحليلات فعّالة واستنباط إشارات مفيدة تتجاوز مجرد الدرجات التراكمية.
لقد قمنا بتقييم إطار العمل الجديد على معايير متقدمة، مثل LLM-SRBench، وأظهرنا كفاءة ودقة أفضل مقارنةً بالأساليب التقليدية. هذه التطورات لا تمهد فقط الطريق لأبحاث جديدة في هذا المجال بل تقدم أيضاً آفاقاً مثيرة في كيفية استخدام تقنية الذكاء الاصطناعي في مجالات متعددة.
ثورة في علم البيانات: التحسين البرمجي للسجلات الرمزية باستخدام نماذج اللغة الكبيرة!
اكتشاف تعبيرات رياضية دقيقة من خلال تقنيات جديدة تعزز قدرة الذكاء الاصطناعي. الدراسة تبرز أهمية تحسين السياق البرمجي في نتائج السجلات الرمزية.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
