يشهد الذكاء الاصطناعي تطوراً ملحوظاً مع الاستخدام المتزايد لنماذج الكلمات الكبيرة (Large Language Models) في تحقيق مهام معقدة. أحد هذه التطورات هو مفهوم "تعليم تسلسل الأفكار" (Chain-of-Thought Learning)، وهو نهج فعال يساعد في تفعيل قدرات التفكير الكامنة في هذه النماذج.
ومع ذلك، يشير البحث الجديد إلى أن معظم الطرق الحالية تستخدم التسلسل في الغالب كتحفيز خلال مرحلة الاستنتاج، مما يجعل من النادر إعادة استخدام آثار التفكير الناتجة كإشارات للتعلم شبه الإشرافي. في هذا السياق، تم تعريف "تعليم تسلسل الأفكار شبه الإشرافي" (Semi-supervised Chain-of-Thought Learning) وطرح إطار عمل جديد تحت مسمى **Semi-CoT**، والذي يهدف إلى استخدام الأسئلة غير المصنفة لبناء إشراف زائف.
يعتمد **Semi-CoT** على أخذ عينات من تسلسلات أفكار زائفة متعددة لكل سؤال غير مصنف، مع تقدير عدد السماحات السيمانتية والإجابة، مما يمكن النموذج من اختيار تسلسلات تفكير ذات سماحة منخفضة كمظاهرات موثوقة. يوضح التجارب الأولية على مجموعات بيانات مثل AQuA وSVAMP وGSM8K وMultiArith أن بوابة السماحة تقوم باختيار تسلسلات عالية الدقة، حيث تتراوح دقة الإجابات الزائفة من 91.36% إلى 100%.
تشير النتائج إلى أن الأسئلة غير المصنفة يمكن أن تكون بمثابة إشارات موثوقة للتفكير، ولكن يتطلب استخدامها الفعّال تحسين تقنيات اختيار المظاهرات أو تدريب النماذج الذكية. يبدو أن هذه الخطوات الجديدة تمهد الطريق لمزيد من الابتكارات في عالم الذكاء الاصطناعي.
ثورة في الذكاء الاصطناعي: تعلم تسلسل الأفكار بنظام شبه إشرافي
تقدم دراسة جديدة مفهوم تعلم تسلسل الأفكار بنظام شبه إشرافي، والذي يسعى لتفعيل قدرات التفكير الكامنة في نماذج اللغات الضخمة. النظريات الجديدة تشير إلى إمكانية استخدام الأسئلة غير المصنفة كمدخلات قوية لتوليد إشراف زائف فعّال.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
