في عالم الذكاء الاصطناعي، لا تتوقف الابتكارات عند حدود التقنية، بل تتجاوزها لتلامس جوانب تفكيرنا الإنساني. يقدم البحث الجديد المُعنون 'من الفكر إلى التنفيذ: التكيف المعرفي ما بعد التدريب لنماذج اللغات الضخمة (Large Language Models) العامة والموثوقة' إطار عمل ثوري يحاكي العمليتين المعرفيتين التي يتبعها الإنسان في حل المشكلات.

تعتبر الطرق الحالية في ما بعد التدريب هذه النماذج فعالة، لكنها تعتمد على مسارات استدلالية كاملة من خلال التكييف الدقيق تحت الإشراف (Supervised Fine-Tuning - SFT) يتبعه التعلم المدعوم بالنتائج (Reinforcement Learning - RL). لكن، يُظهر البحث أن هذه الطرق تنطوي على فجوة جوهرية؛ فهي لا تتماشى مع كيفية حل البشر للمشكلات.

إن التفكير البشري بطبيعته يقوم بتجزئة حل المشكلات إلى نطاقين متميزين: الأول هو اكتساب استراتيجيات مجردة (أي معرفة ميتا) تعمم عبر المشاكل، والثاني هو تكييفها وفقًا للحالات المحددة. في المقابل، فإن الطرق الحالية، من خلال اعتبارها المسارات الكاملة كعناصر أساسية، تركز بشكل كبير على المشكلات، مما يربط الاستراتيجيات المجردة بالتنفيذ الخاص بالمشكلات.

لمعالجة هذا الخطأ في التوافق، يطرح الباحثون إطار عمل مستلهم من العمليات المعرفية البشري، يتمحور حول عمليتين أساسيتين. الأول هو 'سلسلة أفكار الميتا (Chain-of-Meta-Thought CoMT)'، حيث يتم التركيز على التعلم تحت الإشراف للاستراتيجيات المجردة دون أي تنفيذ محدد، مما يمكِّن من اكتساب استراتيجيات عامة. أما الثاني، 'التعلم المدعوم بالثقة (Confidence-Calibrated Reinforcement Learning - CCRL)'، فيحسن من تكيف المهام من خلال مكافآت واعية بالثقة في الخطوات الوسطية، مما يمنع الأخطاء الزائدة عن الحد من التراكم ويعزز موثوقية التنفيذ.

أظهرت التجارب على أربعة نماذج وعشرة مقاييس تحسينات بنسبة 2.10% و3.86% في الأداء داخل التوزيع وخارج التوزيع على التوالي مقارنة بالطرق التقليدية. وتظل هذه الطريقة قوية للغاية أمام التغيرات في اختيار نموذج المعلم وطرق التكييف والتغيرات الرمزية.

إذا كنت مهتمًا بتطور الذكاء الاصطناعي وكيف يمكن أن يغير طريقة تفكيرنا وحل مشكلاتنا، فما رأيك في هذه الابتكارات؟ شاركونا آرائكم في التعليقات!