في عالم الذكاء الاصطناعي، تعد [نماذج [اللغات](/tag/اللغات) الضخمة](/tag/[نماذج](/tag/نماذج)-[اللغات](/tag/اللغات)-الضخمة) (Large Language [Models](/tag/models)) أحد أبرز الابتكارات، ولكنها تواجه تحدياً كبيراً يتمثل في "النسيان الكارثي" (catastrophic forgetting) عند إدخال [معلومات](/tag/معلومات) جديدة [عبر](/tag/عبر) عملية ما بعد [التدريب](/tag/التدريب). لكن [دراسة جديدة](/tag/[دراسة](/tag/دراسة)-جديدة) تسلط الضوء على [إطار العمل](/tag/إطار-العمل) المبتكر المعروف باسم SPOT، الذي يُمكن أن يكون الحل لهذه المشكلة.
توضح [الأبحاث](/tag/الأبحاث) أن أهمية [البيانات](/tag/البيانات) التي تستخدم في [سياسة](/tag/سياسة) معينة تعد جوهرية، إلا أن استخدام [قياس](/tag/قياس) الدالة [KL](/tag/kl) لم يكن فعّالاً بما يكفي للتقليل من مشكلة النسيان. لكن ما قام به الباحثون هو تقديم صيغة جديدة تقيّد المكافآت، مما يلعب دورًا حاسمًا في الاحتفاظ بالمعرفة خلال مراحل ما بعد [التدريب](/tag/التدريب).
[إطار العمل](/tag/إطار-العمل) [SPOT](/tag/spot) يقوم على محورين رئيسيين: الأول هو [خط أنابيب](/tag/خط-أنابيب) [تصحيح البيانات](/tag/تصحيح-[البيانات](/tag/البيانات)) الذي يستخدم [تقنية](/tag/تقنية) الـ [Oracle](/tag/oracle) لإجراء تصحيحات دقيقة على [الأخطاء](/tag/الأخطاء) من خلال تعديلات طفيفة، مما ينتج [بيانات](/tag/بيانات) تساعد في السياسة المباشرة. والثاني هو هدف الدالة الثنائية للمدى (binary cross-entropy objective) المدعومة بالمكافآت، والتي تعتبر ضرورية لتعزيز عملية [التفكير](/tag/التفكير) وتقليل النسيان.
تُظهر [التجارب](/tag/التجارب) أن استخدام 4,000 مجموعة من [البيانات](/tag/البيانات) [الرياضيات](/tag/الرياضيات) المُصَححة أدّى إلى [تحسين](/tag/تحسين) [دقة النموذج](/tag/[دقة](/tag/دقة)-النموذج) Qwen3-8B بمعدل 6.2% [عبر](/tag/عبر) المهام المختلفة، مع الحاجة إلى 16 دقيقة فقط من [التدريب](/tag/التدريب) على [معالجات](/tag/معالجات) H800 [GPUs](/tag/gpus). وبالإضافة إلى ذلك، يوفر [إطار العمل](/tag/إطار-العمل) [SPOT](/tag/spot) تحسينًا أفضل للبدء بالمراحل التالية من [التعلم](/tag/التعلم) المعزز، مما يساهم في [تحقيق](/tag/تحقيق) [أداء](/tag/أداء) أعلى بكثير.
إن [الإنجازات](/tag/الإنجازات) التي تحققها هذه [التقنية](/tag/التقنية) قد تفتح آفاقاً جديدة في كيفية استخدام [الذكاء الاصطناعي](/tag/الذكاء-الاصطناعي) في المستقبل. فما هو رأيكم في هذا التطور؟ شاركونا في [التعليقات](/tag/التعليقات).
تكنولوجيا جديدة تُعيد الحياة للذكاء الاصطناعي: اكتشف كيفية الحفاظ على المعرفة مع إطار عمل SPOT!
تقدم تقنية SPOT إطارًا ثوريًا للحفاظ على المعرفة أثناء تدريب نماذج الذكاء الاصطناعي، مما يعزز القدرة على التفكير ويقلل من فقدان المعلومات. تعرف على كيفية تحسين دقة نموذج Qwen3-8B بنسبة 6.2% باستخدام هذه التقنية الحديثة.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←# الذكاء الاصطناعي# النماذج اللغوية# التعلم الآلي# SPOT# تحسين الأداء# المدارس اللغوية# التعلم المعزز# التدريب
جاري تحميل التفاعلات...
