تظل قدرة أنظمة الذكاء الاصطناعي، وخاصة نماذج اللغات الضخمة (Large Language Models)، على تحديث المعرفة وتطبيقها بشكل مرن أثناء عمليات التفكير تحديًا مركزيًا. وبالرغم من أن الأساليب الحالية لتحرير المعرفة تركز على الحقائق الذرية، إلا أنها غالبًا ما تفشل في دمج المعلومات المحدثة في إطار متسق يمكن استخدامه عبر سياقات متعددة.
في هذا السياق، يقترح الباحثون أن تحديث المعرفة هو بشكل أساسي مسألة تفكير وليس مجرد استرجاع للذاكرة. وبالتالي، ينبغي تدريب النموذج في مواقف تكون فيها المعلومات الجديدة ضرورية لحل مهمة معينة، مقرونة بمعرفة سابقة، ويتم اختبارها من خلال استدلال متعدد الخطوات.
استنادًا إلى هذه الرؤية، تم اقتراح استراتيجية تدريب تعتمد على ثلاث مبادئ رئيسية. أولاً، يتم تقديم المعرفة الجديدة كقصة خلفية متسقة تضع الحقائق الجديدة في سياق وتشرح علاقتها بالمعرفة الحالية. ثانيًا، يتم تدريب النماذج باستخدام أسئلة ذات خطوات متعددة يتم إنشاؤها ذاتيًا تتطلب استدلالًا متعدد الخطوات يعتمد على المعلومات الجديدة. ثالثًا، يتم إجراء التدريب باستخدام تقنيات تربية المعرفة (Knowledge Distillation)، مما يجبر النموذج الطالب على استيعاب سلوك التفكير للنموذج المعلم دون الوصول إلى المعلومات الجديدة.
أظهرت التجارب أن النماذج المدربة باستخدام هذه الاستراتيجية تستفيد بشكل فعال من المعرفة المكتسبة حديثًا أثناء عمليات الاستدلال، محققة أداءً رائعًا في الأسئلة الصعبة التي تتطلب دمج عدة حقائق جديدة. هل يمكن أن يكون هذا الأسلوب هو المفتاح للذكاء الاصطناعي الأكثر ذكاءً وتفاعلاً؟
تحديث المعرفة بدلاً من الحقائق العادية: استراتيجية جديدة للذكاء الاصطناعي
تكشف دراسة جديدة عن كيفية تمكين أنظمة الذكاء الاصطناعي، خاصة النماذج اللغوية الكبيرة، من تحديث معرفتها وتطبيقها بمرونة خلال عمليات الاستدلال. التركيز الآن هو على التفكير المعقد وليس مجرد استرجاع المعلومات.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
