في عالم الذكاء الاصطناعي، تعتبر مشكلات إرضاء البوليانات ([SAT](/tag/sat)) من بين الأكثر تحديًا، ومع ذلك، برزت [تقنية جديدة](/tag/[تقنية](/tag/تقنية)-جديدة) تعرف باسم "Cube-and-Conquer" (C&C) كحل فعال لهذه التحديات. ولكن ما لم يُعرف حتى الآن هو قدرة [نماذج المحولات](/tag/[نماذج](/tag/نماذج)-[المحولات](/tag/المحولات)) ([Transformers](/tag/transformers)) على [تعلم](/tag/تعلم) [استراتيجيات](/tag/استراتيجيات) [التجزئة](/tag/التجزئة) الفعالة.
لذلك، نقدم في هذا المقال إطار [عمل](/tag/عمل) ما بعد [التدريب](/tag/التدريب) العصبي الرمزي ([Neuro](/tag/neuro)-Symbolic Post-Training) الذي يهدف إلى [تحقيق](/tag/تحقيق) هذا الهدف. يعتمد هذا الإطار على [خط أنابيب](/tag/خط-أنابيب) [تنسيق البيانات](/tag/[تنسيق](/tag/تنسيق)-[البيانات](/tag/البيانات)) المستند إلى [تقنية](/tag/تقنية) [مونت كارلو](/tag/مونت-كارلو) ترويج الشجرة ([MCTS](/tag/mcts))، حيث يستخدم [خوارزميات](/tag/خوارزميات) رمزية لاستكشاف [قرارات](/tag/قرارات) [الفصل](/tag/الفصل) [عبر](/tag/عبر) صيغ [منافسات](/tag/منافسات) SAT، مما يؤدي إلى إنتاج [بيانات تفضيل](/tag/[بيانات](/tag/بيانات)-تفضيل) تستند إلى [إحصاءات](/tag/إحصاءات) الحلول معززًا بخطوات استدلالية من [نموذج](/tag/نموذج) معلم.
تشمل [العملية](/tag/العملية) تدريبًا بعديًا من مرحلتين: [تحسين](/tag/تحسين) دقيق تحت إشراف ([SFT](/tag/sft)) يليه [تحسين](/tag/تحسين) [تفضيلات](/tag/تفضيلات) مباشر ([DPO](/tag/dpo)). هذا النهج يمكّن نموذجاً يضم 4 مليارات معلمة من [تحقيق](/tag/تحقيق) نتيجة تصل إلى 53 في اختبار pass@5 على 100 معيار لمنافسات SAT، متجاوزًا [نماذج](/tag/نماذج) [LLM](/tag/llm) الرائدة مثل [Claude](/tag/claude)-[Sonnet](/tag/sonnet)-4 التي حققت 50، وملائمةً لأفضل [خوارزمية](/tag/خوارزمية) رمزية (53).
قد أظهرت الدراسات المختلفة أن [SFT](/tag/sft) بمفرده يمكن أن يُحسن النتيجة من 46 إلى 51، مع إضافة [DPO](/tag/dpo) استقراراً لنتائج إضافية. ومن المثير للاهتمام أن [تحليل](/tag/تحليل) [التنوع](/tag/التنوع) في القرارات الأولى يُظهر أن [SFT](/tag/sft) هو الذي يساهم في تباين القرارات الجذرية، مما يوفر تغطية متكاملة على الطرق الرمزية الحاسوبية.
هذه النتائج تفتح آفاقاً جديدة في كيفية [تدريب](/tag/تدريب) [نماذج المحولات](/tag/[نماذج](/tag/نماذج)-[المحولات](/tag/المحولات)) على اتخاذ [قرارات](/tag/قرارات) [تجزئة](/tag/تجزئة) فعالة في مجال تقليدي الهيمنة فيه على الأساليب الرمزية، مما يشير إلى [مستقبل](/tag/مستقبل) مشرق لتقنيات [الذكاء الاصطناعي](/tag/الذكاء-الاصطناعي) في حل المشاكل المعقدة.
تعلم فن تجزئة المشكلات: كيف يمكن للنماذج المبنية على المحولات (Transformers) تحسين خوارزميات التقسيم
تتجاوز النماذج المبنية على المحولات حدود معتقداتنا في معالجة مشكلات SAT. هذا المقال يكشف عن كيفية استخدام إطار عمل مبتكر يمكن هذه النماذج من تعلم استراتيجيات التجزئة بفعالية.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
