في عالم الذكاء الاصطناعي، تُعتبر النماذج القائمة على تقنيات اللغات الكبيرة (Large Language Models) أدوات قوية، لكنها، كمستخدمين بشريين، ترتكب الأخطاء. لكن ما هو الحل؟ هنا يأتي دور النقد الذاتي. تم تطوير إطار عمل جديد يُعرف بـ "تعلم النقد الذاتي" باستخدام التعلم المعزز (ICRL)، بحيث يمكن لهذه النماذج أن تحقق تحسنًا حقيقيًا في أدائها من خلال الاستفادة من النقد.
تُظهر الأبحاث أن إزالة النقد من العملية التعليمية يمكن أن تؤدي إلى تكرار الأخطاء، مما يدل على أن النموذج لم يتمكن من استيعاب التوجيهات المُعطاة. كما أن الانتقادات الثابتة لا تسمح بتحسين جودة ملاحظاتها مع الوقت، مما يحد من إمكانيات تحسين النموذج بشكل تدريجي.
وتهدف طريقة ICRL إلى تعليم النماذج كيفية استيعاب النقد الذاتي لتطوير أداءها الذاتي دون الاعتماد على النقد الخارجي. يقوم النظام بتشجيع النموذج على تحسين أدائه بناءً على مكافآت يتم تقديمها عند تحقيق تحسينات بيّنة بعد استخدام النقد. لا تقتصر فوائد هذه الطريقة على إعداد النموذج، بل تشمل أيضًا تقديم تحسينات مستدامة تسهم في تحقيق أداء أفضل على مر الزمن.
أظهرت الاختبارات على مجموعة من المهام المعقدة، مثل المهام المتعلقة بالوكالة (agentic) والمشاكل الرياضية، تحسنًا ملحوظًا بمتوسط زيادة يصل إلى 6.4 نقاط للمهمات الوكالية و7.0 نقاط في المشكلات الرياضية عند مقارنة ICRL بأساليب أخرى. يمكنكم الاطلاع على الكود الخاص بهذه التقنية من خلال هذا الرابط.
إن ظهور نماذج مثل ICRL يعكس مستقبلًا أكثر تقدمًا في تقنيات الذكاء الاصطناعي، حيث يمكن للنماذج أن تتعلم وتنمو دون الاعتماد الكلي على تدخلات خارجية. فهل تؤمنون أن النقد الذاتي سيكون له الدور الأكبر في تطوير الذكاء الاصطناعي؟ شاركونا آرائكم في التعليقات!
تعلم النقد الذاتي: كيف يغير التعلم المعزز مستقبل نماذج الذكاء الاصطناعي!
تمثل تقنية التعلم المعزز (Reinforcement Learning) ثورة في كيفية تعلم نماذج الذكاء الاصطناعي من أخطاءها. تعرفوا على طريقة ICRL لتحسين الأداء الداخلي من خلال النقد الذاتي.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
