في عالم الذكاء الاصطناعي، يعد [فهم](/tag/فهم) [سلوك النماذج](/tag/[سلوك](/tag/سلوك)-[النماذج](/tag/النماذج)) ذات المعلمات المفرطة (Over-parameterized [Models](/tag/models)) أمراً أساسياً. [دراسة جديدة](/tag/[دراسة](/tag/دراسة)-جديدة) تتناول الحالة المثيرة للتعايش بين التذكر والتعميم تحت ظروف صعبة، حيث يتم التعامل مع مهام حسابية تتضمن [ضوضاء](/tag/ضوضاء) في التسمية.
خلال [التجارب](/tag/التجارب) المكثفة على [الشبكات العصبية](/tag/[الشبكات](/tag/الشبكات)-العصبية) الثنائية الطبقات، تبين أن [النماذج](/tag/النماذج) الأكبر حجماً تميل إلى [تحقيق](/tag/تحقيق) نتائج عامة أفضل عند اعتماد تكوينات وتحسينات ملائمة. وعلى الرغم من الفوضى التي تسببت بها التسمية الملوثة، فإن [النماذج](/tag/النماذج) تسجل تذكراً أسرع لهذه [البيانات](/tag/البيانات) مقارنة بالبيانات النظيفة.
تشير النتائج إلى أن [النماذج](/tag/النماذج) ذات المعلمات المفرطة تُشكل [هيكلة](/tag/هيكلة) داخلية للتعميم، لكن التعبير عن هذه الهيكلية في المخرجات يقيّد بفعل الحاجة لتناسب [البيانات](/tag/البيانات) الملوثة. لافتة للانتباه، حتى مع وجود 80% من الضوضاء في التسمية، يمكن الوصول إلى [دقة](/tag/دقة) اختبار قريبة من الكمال من خلال استخدام [أساليب](/tag/أساليب) قائمة على التكرار لاستخراج الهيكل الداخلي.
علاوة على ذلك، اقترح الباحثون طريقة مستقلة عن المهمة لتقسيم [الشبكات](/tag/الشبكات) إلى مكونات [التعميم](/tag/التعميم) والتذكر. ومع أن هذا الهيكل الفرعي يحسن التعميم، إلا أنه يظل محدوداً مقارنة باستخراج [البيانات](/tag/البيانات) المعتمد على التكرار. مما يسلط الضوء على أن بنية [التعميم](/tag/التعميم) موزعة [عبر](/tag/عبر) الخلايا العصبية، مما يحفز الحاجة إلى [تطوير](/tag/تطوير) [أدوات جديدة](/tag/[أدوات](/tag/أدوات)-جديدة) لاسترجاع [المعرفة](/tag/المعرفة) القابلة للتعميم من [الشبكات](/tag/الشبكات) ذات المعلمات المفرطة.
كشف أسرار التعايش بين التذكر والتعميم: دراسة حالة على مهام حسابية مع ضوضاء في التسمية
يعرض هذا البحث آلية التعايش بين تذكر البيانات الملوثة بالتسمية وقدرة النماذج على التعميم. تكشف النتائج عن سلوك فريد للنماذج ذات المعلمات المفرطة وكيفية تحسين أدائها حتى في حالات الضوضاء العالية.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
