هل تساءلت يومًا عن كيفية [تحسين](/tag/تحسين) [نماذج الذكاء الاصطناعي](/tag/[نماذج](/tag/نماذج)-الذكاء-الاصطناعي) ([AI](/tag/ai)) استجابتها خلال وقت الاختبار؟ يتناول هذا المقال [دراسة جديدة](/tag/[دراسة](/tag/دراسة)-جديدة) تبحث في العلاقة بين [المعرفة السابقة](/tag/[المعرفة](/tag/المعرفة)-السابقة) (prior knowledge) والتعديل الزمنية (test-time augmentation) التي تشمل [تقنيات](/tag/تقنيات) مثل الاسترجاع المعزز بالجيل ([Retrieval-Augmented Generation](/tag/retrieval-augmented-generation)) واستخدام [الأدوات](/tag/الأدوات).

تشير [الدراسة](/tag/الدراسة) إلى أن استجابة النموذج تعتمد بشكل حاسم على تداخل [المعرفة](/tag/المعرفة) البرمجية للنموذج مع [المعلومات](/tag/المعلومات) المسترجعة من الخارج. ومع ذلك، لا تزال الأسس النظرية لهذا [التفاعل](/tag/التفاعل) غير مفهومة بشكل جيد. فعلى سبيل المثال، هل يكفي [تدريب النموذج](/tag/[تدريب](/tag/تدريب)-النموذج) على جزء بسيط من [المعرفة](/tag/المعرفة) للإجابة على استفسارات متكررة؟

للإجابة عن هذا السؤال، تم تعريف [التفكير متعدد الخطوات](/tag/[التفكير](/tag/التفكير)-متعدد-الخطوات) كمشكلة ربط على [رسم بياني معرفي](/tag/رسم-بياني-معرفي) (knowledge graph). حيث يتم تمثيل [المعرفة](/tag/المعرفة) البرمجية للنموذج كقائمة فرعية جزئية، قد تكون ملوثة بالضجيج. ومن ثم يتم اعتبار [التعديل](/tag/التعديل) كطلب لمعلومات صحيحة تعزز من [معرفة](/tag/معرفة) النموذج.

تظهر النتائج الرئيسية لهذه [الدراسة](/tag/الدراسة) انتقالًا في المرحلة: فإذا كان رسم [المعرفة](/tag/المعرفة) السابق مكونًا من $n$ نقطة غير متصل بأجزاء صغيرة، فإن العثور على مسار [عبر](/tag/عبر) [التعديل](/tag/التعديل) يصبح غير فعال ويتطلب عددًا كبيرًا من الاستفسارات. بينما إذا تجاوزت [كثافة المعرفة](/tag/كثافة-[المعرفة](/tag/المعرفة)) الصحيحة عتبة معينة، وتم تكوين مكون ضخم، يصبح من الممكن العثور على مسارات باستخدام [عدد](/tag/عدد) ثابت من الاستفسارات، مما يفتح آفاق جديدة لفهم عملية التعزيز المعرفي.

كيف ترى تأثير [المعرفة السابقة](/tag/[المعرفة](/tag/المعرفة)-السابقة) في تعزيز [أداء](/tag/أداء) [نماذج الذكاء الاصطناعي](/tag/[نماذج](/tag/نماذج)-الذكاء-الاصطناعي)؟ شاركونا آرائكم في [التعليقات](/tag/التعليقات)!