في عالم الذكاء الاصطناعي المتسارع، تتزايد الحاجة إلى نماذج لغوية قادرة على التفكير والتعلم بشكل أفضل. تقدم لنا الدراسة الجديدة SuperThoughts، وهي ابتكار يهدف إلى تحسين عملية الاستدلال لدى نماذج اللغة الضخمة (LLMs) من خلال تقنية مبتكرة تُعرف باسم Multi-Token Prediction (MTP).
تُظهر الأبحاث السابقة أن أسلوب Chain-of-Thought (CoT) في التفكير يعزز قدرة واجهات الذكاء الاصطناعي على حل المشكلات، لكن هذا النوع من التفكير غالبًا ما يتطلب وقتًا طويلًا نظرًا لتوليد الرموز بشكل تسلسلي. لتجاوز هذه العقبة، يقدم فريق البحث في SuperThoughts طريقة تُحوّل أزواج الرموز المتتالية إلى تمثيلات كامنة، مما يسمح بفك تشفير رمزين في كل خطوة، مما يضاعف فعالية المعالجة.
تأتي عملية التدريب مع SuperThoughts بدعم من آلية تحكم تعتمد على الثقة، حيث يتم العودة إلى فك التشفير التقليدي عند الشك وعدم اليقين. هذه التقنية الجديدة لم تُحدث ثورةً فقط في سرعة الأداء، بل ساهمت أيضاً في تقليل طول سلسلة CoT بنسبة 20-30% مع الحفاظ على دقة المعايير المطلوبة.
تمت تجربة هذا الابتكار على نماذج مثل Qwen2.5-Math-1.5B-Instruct وQwen2.5-Math-7B-Instruct وQwen2.5-Math-14B-Instruct، حيث تم تقييم أدائها عبر مجموعة من المهام الرياضية المعقدة مثل MATH500 وAMC وOlympiadBench وGPQA-Diamond. النتائج تشير إلى أن SuperThoughts لا يحقق فقط تحسينات كبيرة في الأداء ولكنه يقوم بذلك مع الحد الأدنى من تدهور الدقة، حيث سجّلت بعض المهام انخفاضًا في الدقة يتراوح بين نقطة إلى نقطتين.
من الواضح أن SuperThoughts يمثل خطوة إيجابية نحو عوالم أذكى في الذكاء الاصطناعي، مما يوفر أدوات جديدة تفتح آفاقًا لتطبيقات مستقبلية مرنة وسريعة.
معجزة SuperThoughts: ثورة في تفكير الذكاء الاصطناعي بتفكيك الرموز
تقديم SuperThoughts يكشف كيف يمكن للذكاء الاصطناعي تحسين استدلاله بطريقة مبتكرة تقلل من زمن معالجة الرموز. هذا الابتكار يعد خطوة مثيرة نحو تحسين دقة نماذج اللغة الضخمة (LLMs) وتجاوز تحديات التعلم المعقد.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
