في عالم الذكاء الاصطناعي، تعتبر نماذج اللغة الكبيرة (Large Language Models) من أهم الأدوات المستخدمة في معالجة اللغة. ومع ذلك، تظهر التحديات عندما يتم تقديم المعلومات بشكل متقطع عبر محادثات متعددة. في دراسة جديدة، تم توضيح كيف أن النماذج غالباً ما تتمكن من الإجابة بشكل صحيح عند توفر جميع التعليمات دفعة واحدة، لكنها تفشل عندما يتم الكشف عن نفس المعلومات تدريجياً.

المشكلة تكمن فيما يُعرف بـ"التحول الذاتي" (self-anchored drift)، حيث تساهم الاستجابات الناتجة عن معلومات جزئية في إضافة افتراضات غير مدعومة، مما يؤدي إلى تشويه الإجابات النهائية. لذا، تم اقتراح تقنية جديدة تُعرف بـ"تقطير السياق القياسي" (Canonical-Context On-Policy Distillation - CCOPD) كحل لهذه المشكلة.

تعتمد تقنية CCOPD على استخدام نموذجين: نموذج مُجمَّد يعمل كمدرس يُعتمد على المعلومات الكاملة، ونموذج يُحسَّن تدريجياً كطالب يستقبل الأدلة بشكل متقطع. تهدف هذه التقنية إلى تنسيق سلوك الطالب مع سلوك المدرس بناءً على السياق الكامل.

أظهرت نتائج الدراسة أن CCOPD حققت تحسناً نسبته 32% في أداء المحادثات الرياضية، مع الحفاظ على الأداء في السياقات الكاملة. وتبين أن هذه التقنية تعزز من مصداقية استجابات النموذج وتقلل من التأثر بسلوك المحادثات السابقة.

بهذا التطور، تأمل الأبحاث في تثبيت الأسس العلمية لتحسين نماذج الذكاء الاصطناعي وزيادة فعاليتها في تقديم إجابات دقيقة في جميع السيناريوهات. ما رأيكم في هذا التطور؟ شاركونا في التعليقات.