تواجه نماذج اللغات الضخمة (Large Language Models) في الآونة الأخيرة ضغوطًا متزايدة تتطلب منها "نسيان" بيانات التدريب أو المعرفة أو السلوكيات، وذلك بسبب التزامات الحذف التنظيمية، وحقوق النشر/الترخيص، ومتطلبات السلامة أو السياسات المتعلقة بالمنتجات.
في ورقة بحثية حديثة، تم التأكيد على أن مصطلح "التعلم الآلي النسيان" يُستخدم بشكل مفرط في أبحاث نماذج اللغات الضخمة، ويجب أن يقتصر على الحذف الذي تحدده مجموعة بيانات معينة: أي إزالة التأثيرات التدريبية لمجموعة محددة بصورة دقيقة لكي يصبح النموذج الناتج غير قابل للتمييز تقريبًا عن إعادة التدريب دون تلك البيانات.
تجادل الورقة بأن العديد من المهام التي تُصنف حاليًا على أنها "نسيان"، مثل رفض الطلبات الضارة أو إزالة الكيانات/المعرفة أو القمع المستهدف، تسعى لتحقيق أهداف مختلفة، وغالبًا ما تكون مرتبطة بالسياسات، وبالتالي تحتاج إلى مصطلحات وبنية أساسية مختلفة مثل المحاذاة (Alignment) أو القمع (Suppression) أو التعديل (Editing) أو التعتيم (Obfuscation).
لم يُعتبر هذا الخلط سطحيًا، بل يُعيد التفكير في الضمانات الضمنية التي توفرها الأوراق البحثية تحت نفس المصطلح. كما أن المقاييس والمعايير تُستخدم كثيرًا خارج نطاقها المقصود، مما يُعزز التقييمات السطحية مثل انخفاض دقة ROUGE/نسيان البيانات، حتى عند عدم اختبار معادلة إعادة التدريب، وتظل القدرات المنبثقة قائمة.
لتجنب هذا الخلط، اختتمت الورقة بالدعوة إلى اعتماد مصطلحات أكثر دقة مرتبطة بالضمانات الصريحة والنماذج المرجعية، بالإضافة إلى تقييمات تتناسب مع الأهداف المعلنة.
تحديات وتعقيدات مصطلح "التعلم الآلي النسيان" في نماذج اللغات الضخمة
يستعرض البحث أهمية إعادة النظر في استخدام مصطلح "التعلم الآلي النسيان" في الأبحاث المتعلقة بنماذج اللغات الضخمة، ويشدد على ضرورة وضع مصطلحات أكثر دقة تناسب الأهداف المختلفة. يسلط الضوء على تأثير هذه المصطلحات على دقة التقييمات والنتائج.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
