في عالم الذكاء الاصطناعي، تعتبر النماذج اللغوية الكبيرة (Large Language Models) محورية لتوليد النصوص وفهم اللغات. لكن مع مرور الزمن وتحديث المعلومات، قد تصبح هذه النماذج عتيقة أو تحتوي على معلومات غير صحيحة. هنا يأتي دور التعديل على النماذج (Model Editing)، الذي يقدم الحلول اللازمة لتحديث سلوكها المستهدف دون المساس بالمعلومات الحيوية التي تحتفظ بها.
يستند البحث الجديد المُسمى HoReN إلى أفكار مبتكرة لتحسين عملية تعديل النماذج. فهو يستخدم طبقة MLP منفردة مع دليل مفاتيح وقيم منفصل (Key-Value Codebook)، حيث يتم تفسير كل إدخال كقيمة مشتركة بين مفتاح ذاكرة معرفية ونمط مخزن حديث.
الأمر الأكثر إثارة هو أن HoReN يُحقق استرجاع المعرفة من خلال تقديرات متطورة للغاية تعتمد على الشبه الزاوي، مما يزيل الفروقات النابعة من الحجم بين نداءات التعديل وإعادة صياغتها. يقوم أيضاً بتعديل الاستعلامات عبر ديناميات جذب هوفيلد (Hopfield Attractor Dynamics)، مما يسمح بانتقال إعادة الصياغة إلى مناطق استقرار المعرفة الصحيحة.
ولقد أثبت HoReN أدائه القوي من خلال تحقيق نتائج متسقة عبر اختبارات متعددة، وظل مستقرًا حتى عند إجراء 50,000 تعديل تسلسلي. في حين تدهورت المحررات السابقة بشكل حاد عند الوصول إلى 10,000 تعديل، يظل HoReN متفوقًا باستمرار.
يمكنك معرفة المزيد عن هذا الابتكار المذهل من خلال زيارة الرابط: [HoReN على GitHub](https://github.com/ha11ucin8/HoReN). هل تعتقد أن هذه التقنيات ستغير طريقة تعاملنا مع النماذج اللغوية في المستقبل؟ شاركونا آراءكم في التعليقات.
HoReN: ثورة في تحرير النماذج اللغوية عبر استرجاع معرفي محسن!
يقدم بحث HoReN طريقة مبتكرة لتحرير النماذج اللغوية دون المساس بمعارفها الأساسية. من خلال استخدام تقنيات متطورة، تحقق HoReN أداءً متسقًا وحفاظًا على المعلومات في جميع السيناريوهات.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
