في عالم الذكاء الاصطناعي، تواجه [نماذج [اللغة](/tag/اللغة) الضخمة](/tag/[نماذج](/tag/نماذج)-[اللغة](/tag/اللغة)-الضخمة) (Large Language [Models](/tag/models)) [تحديات](/tag/تحديات) هائلة تتعلق بتنوع [البيانات](/tag/البيانات) واختلافها. وعندما يتعلق الأمر بالتحسين الفيدرالي، تظهر مشكلات تتعلق بالتوزيع الإحصائي غير المتجانس، مما يؤثر على [دقة النماذج](/tag/[دقة](/tag/دقة)-[النماذج](/tag/النماذج)) وتوافقها.
في هذا السياق، يبرز نهج مبتكر يسمى "[التقطير](/tag/التقطير) الذاتي الفيدرالي" (Federated [Self-Distillation](/tag/self-distillation) أو FedSD)، والذي يُعتبر [استراتيجية](/tag/استراتيجية) رائدة لتحسين [الأداء](/tag/الأداء). يقوم FedSD بتوجيه [تمثيلات](/tag/تمثيلات) [البيانات](/tag/البيانات) لمختلف العملاء إلى [فضاء](/tag/فضاء) مفاهيمي منسق، مما يزيد من فعالية [النماذج](/tag/النماذج) مقارنةً بالأساليب التقليدية.
ومع ذلك، تبين أن هناك نوعًا من التبادل الدقيق يعرف بـ "مفارقة إعادة [الكتابة](/tag/الكتابة)" (Rewrite Paradox)، حيث يمكن أن يؤدي [التحسين](/tag/التحسين) غير المقيد إلى زيادة الهلوسات والتكرار في النتائج. للتغلب على هذه التحديات، قدم الباحثون مفهوم [FedSDR](/tag/fedsdr) ([التقطير](/tag/التقطير) الذاتي الفيدرالي مع التصحيح)، الذي يمثل الإطار المعزز النهائي.
يعتمد [FedSDR](/tag/fedsdr) على آلية مزدوجة تضم فرع "[LoRA](/tag/lora)-S" (Smoothing) المحلي المخصص لاحتواء [التباين](/tag/التباين) من خلال [بيانات](/tag/بيانات) مقطرة، وفرع "[LoRA](/tag/lora)-R" (Rectification) العالمي الذي يتركز على [البيانات](/tag/البيانات) الأصلية لضمان [صحة](/tag/صحة) [المعلومات](/tag/المعلومات). من خلال [تجميع البيانات](/tag/تجميع-[البيانات](/tag/البيانات)) من فرع [LoRA](/tag/lora)-R فقط، ينتج [FedSDR](/tag/fedsdr) نموذجًا عالميًا متوازنًا وموثوقًا.
تُظهر [التجارب](/tag/التجارب) الشاملة التي أجريت على هذا النهج تفوقه في [الأداء](/tag/الأداء) مقارنةً بالطرق الأخرى، مما يفتح آفاقًا جديدة لمستقبل [نماذج الذكاء الاصطناعي](/tag/[نماذج](/tag/نماذج)-الذكاء-الاصطناعي).
اكتشاف ثوري: FedSDR يغير مفهوم تحسين نماذج الذكاء الاصطناعي!
قدم الباحثون أسلوبًا مبتكرًا يُعرف باسم FedSDR، الذي يحسن أداء نماذج الذكاء الاصطناعي من خلال نموذج التعلم الفيدرالي. يعتمد هذا النهج على آلية مزدوجة لتحقيق دقة وموثوقية أعلى في نتائج النماذج.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
