تحسين تفكير نماذج اللغة الضخمة من خلال النقد اللفظي: اكتشافات غير مسبوقة!
🧠 نماذج لغوية2 دقائق للقراءة👁 0 مشاهدة

تحسين تفكير نماذج اللغة الضخمة من خلال النقد اللفظي: اكتشافات غير مسبوقة!

تقدم دراسة جديدة مفهوم الإشراف اللفظي كرافد جديد لتحسين أداء نماذج اللغة الضخمة، مما يفتح آفاقًا جديدة في التصحيح والتدريب. النتائج توضح كيف يمكن أن تقود التعليقات اللفظية إلى تحسينات ملحوظة في القدرة على التفكير.

في عصر الذكاء الاصطناعي، تُعتبر نماذج اللغة الضخمة (Large Language Models) أحد أهم الابتكارات التقنية اليوم. وقد أثبتت دراسة جديدة أنها لا تعزز الأداء فحسب، بل تطور استراتيجيات التفكير من خلال مفهوم جديد يُعرف بالإشراف اللفظي (Verbal Process Supervision - VPS).

تسعى الدراسة إلى تحقيق تحسينات في استنتاج النماذج على ثلاثة محاور رئيسية: عمق السلسلة، اتساع العينة، والمقيّمي الخطوات المتعلمين (Performance Rating Metrics - PRMs). ولكن، يُضاف إلى هذا الثلاثي محور رابع، وهو تنويع الإشراف الخارجي من خلال النقد اللفظي.

تستند فكرة VPS إلى استخدام التعليقات اللفظية المهيكلة من مشرف أقوى لمساعدة النموذج في دورة تفاعلية تتضمن توليد النقد وتنقيح الإجابات، وذلك ضمن ميزانية محددة.

أظهرت النتائج من خلال التجارب على مجموعة بيانات GPQA Diamond وAIME 2025 وLiveCodeBench V6 أن VPS حققت نتائج مُدهشة. على سبيل المثال، نموذج GPT-5.4 (المرتفع) استطاع أن يصل إلى دقة 94.9% في GPQA بتكلفة قدرها 4 دورات، متجاوزًا بذلك المستوى القياسي السابق البالغ 94.1% دون الحاجة إلى تحديثات تدريجية.

علاوة على ذلك، في تجربة AIME 2025، نجح VPS في إنقاذ النتائج الضعيفة، حيث زادت النطاقات من 11.7-26.7% إلى 63.3-90%، ما يعكس تحسينات هائلة. وعند مقارنة الأداء مع طرق أخرى مثل Reflexion، أثبت VPS تفوقه بنقاط إضافية تتراوح بين 8.5 و12.1.

ومع ذلك، الأداء يتأثر بمدى الفجوة في القدرة بين المشرف والممثل (Pearson r=0.90) بحيث ينخفض عندما تكون الأخطاء غير قابلة للتعبير لغويًا، مثل في توليد الأكواد، مما يستدعي البحث في طرق هجينة تجمع بين النقد اللفظي والتنفيذي.

ختامًا، هذه النتائج ترسخ أهمية تنويع النقد اللفظي كتوجه جديد لتحسين أداء النماذج في الزمن الحقيقي، وهو ما قد يفتح آفاقًا جديدة أمام مطوري الذكاء الاصطناعي في المستقبل.
المصدر:أركايف للذكاءاقرأ المصدر الأصلي ←
مشاركة:𝕏واتسابتيليجراملينكدإن

📰 أخبار ذات صلة