في عالم الذكاء الاصطناعي، تعتبر مشكلات إرضاء البوليانات ([SAT](/tag/sat)) من بين الأكثر تحديًا، ومع ذلك، برزت [تقنية جديدة](/tag/[تقنية](/tag/تقنية)-جديدة) تعرف باسم "Cube-and-Conquer" (C&C) كحل فعال لهذه التحديات. ولكن ما لم يُعرف حتى الآن هو قدرة [نماذج المحولات](/tag/[نماذج](/tag/نماذج)-[المحولات](/tag/المحولات)) ([Transformers](/tag/transformers)) على [تعلم](/tag/تعلم) [استراتيجيات](/tag/استراتيجيات) [التجزئة](/tag/التجزئة) الفعالة.

لذلك، نقدم في هذا المقال إطار [عمل](/tag/عمل) ما بعد [التدريب](/tag/التدريب) العصبي الرمزي ([Neuro](/tag/neuro)-Symbolic Post-Training) الذي يهدف إلى [تحقيق](/tag/تحقيق) هذا الهدف. يعتمد هذا الإطار على [خط أنابيب](/tag/خط-أنابيب) [تنسيق البيانات](/tag/[تنسيق](/tag/تنسيق)-[البيانات](/tag/البيانات)) المستند إلى [تقنية](/tag/تقنية) [مونت كارلو](/tag/مونت-كارلو) ترويج الشجرة ([MCTS](/tag/mcts))، حيث يستخدم [خوارزميات](/tag/خوارزميات) رمزية لاستكشاف [قرارات](/tag/قرارات) [الفصل](/tag/الفصل) [عبر](/tag/عبر) صيغ [منافسات](/tag/منافسات) SAT، مما يؤدي إلى إنتاج [بيانات تفضيل](/tag/[بيانات](/tag/بيانات)-تفضيل) تستند إلى [إحصاءات](/tag/إحصاءات) الحلول معززًا بخطوات استدلالية من [نموذج](/tag/نموذج) معلم.

تشمل [العملية](/tag/العملية) تدريبًا بعديًا من مرحلتين: [تحسين](/tag/تحسين) دقيق تحت إشراف ([SFT](/tag/sft)) يليه [تحسين](/tag/تحسين) [تفضيلات](/tag/تفضيلات) مباشر ([DPO](/tag/dpo)). هذا النهج يمكّن نموذجاً يضم 4 مليارات معلمة من [تحقيق](/tag/تحقيق) نتيجة تصل إلى 53 في اختبار pass@5 على 100 معيار لمنافسات SAT، متجاوزًا [نماذج](/tag/نماذج) [LLM](/tag/llm) الرائدة مثل [Claude](/tag/claude)-[Sonnet](/tag/sonnet)-4 التي حققت 50، وملائمةً لأفضل [خوارزمية](/tag/خوارزمية) رمزية (53).

قد أظهرت الدراسات المختلفة أن [SFT](/tag/sft) بمفرده يمكن أن يُحسن النتيجة من 46 إلى 51، مع إضافة [DPO](/tag/dpo) استقراراً لنتائج إضافية. ومن المثير للاهتمام أن [تحليل](/tag/تحليل) [التنوع](/tag/التنوع) في القرارات الأولى يُظهر أن [SFT](/tag/sft) هو الذي يساهم في تباين القرارات الجذرية، مما يوفر تغطية متكاملة على الطرق الرمزية الحاسوبية.

هذه النتائج تفتح آفاقاً جديدة في كيفية [تدريب](/tag/تدريب) [نماذج المحولات](/tag/[نماذج](/tag/نماذج)-[المحولات](/tag/المحولات)) على اتخاذ [قرارات](/tag/قرارات) [تجزئة](/tag/تجزئة) فعالة في مجال تقليدي الهيمنة فيه على الأساليب الرمزية، مما يشير إلى [مستقبل](/tag/مستقبل) مشرق لتقنيات [الذكاء الاصطناعي](/tag/الذكاء-الاصطناعي) في حل المشاكل المعقدة.