في عالم الذكاء الاصطناعي، تُعتبر نماذج اللغات الضخمة (Large Language Models) مثالاً على التطورات المذهلة في قدرات التفكير والتخطيط. تكمن إحدى أبرز الابتكارات في نموذج CoCoNuT (Chain of Continuous Thought)، الذي يسمح للنماذج بالتفكير في فضاء مخفي، مستكشفةً مسارات تفكير متعددة في الوقت ذاته بدلاً من التقيد بسلسلة واحدة.
ومع ذلك، ظهرت مشكلة تُعرف باسم "عُقْدَة المفهوم"، حيث يتم استبدال الحالات المخفية الوسيطة أثناء كل دورة تفكير، مما يؤدي إلى فقدان معلومات حيوية تم حسابها في المراحل السابقة، خاصة مع تعميق مستوى التفكير. هذا ما لاحظناه عند اختبار نموذج CoCoNuT التقليدي على مهام مثل HotpotQA، حيث لم يحقق أي تحسن مقارنة بأساسيات Chain of Thought.
لمعالجة هذه القضية، تم تطوير تقنية جديدة تُعرف باسم AGCLR (Adaptive Gated Continuous Latent Reasoning). يضيف AGCLR "تدفق المفهوم المقيد" الذي يحتفظ بذاكرة بقايا مستمرة بين جميع مرات التفكير. يتم التحكم في هذه الذاكرة بواسطة ثلاثة أبواب تعلمية، هي: باب الكتابة الذي يحفظ الحقائق الوسيطة، باب القراءة الذي يسترجع الحالات السابقة ذات الصلة، وباب النسيان الذي يتخلص من السياقات غير المهمة.
جاءت النتائج واعدة، حيث أظهرت تقييمات AGCLR على Datsets مثل GSM8K و HotpotQA و ProsQA تحسينات ملحوظة عبر جميع الأنواع. مع اتساع الفجوة في الأداء كلما زاد عمق المنهاج، فإن AGCLR يمثل حلاً فعّالاً لعقدة المفهوم. للمزيد من التفاصيل، يُمكنكم زيارة رابط الكود الخاص بالبحث.
ثورة في نماذج اللغة: كيف يعزز الذكاء الاصطناعي قدرات التفكير المستمر؟
نماذج اللغات الضخمة تتجاوز الحدود التقليدية، مما يمكّنها من التفكير في مسارات متعددة دون فقدان المعلومات. الابتكار الجديد AGCLR يعد بتحسين الأداء في مهام متعددة التنفيذ.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
