في عصر الذكاء الاصطناعي الحديث، تقدم نماذج اللغات الضخمة (Large Language Models) حلولاً متقدمة لمجموعة متنوعة من التطبيقات. ومع ذلك، فإن تحسين هذه النماذج في إطار التعلم الفيدرالي يعد تحدياً كبيراً. هنا يأتي دور FLoRIST، الإطار الجديد الذي يهدف إلى تحسين الكفاءة والدقة في عملية التعليم الفيدرالي.
لقد أثبتت التكييفات منخفضة الترتيب (Low-Rank Adaptation - LoRA) أنها وسيلة واعدة لتحقيق تحسين فعال لنماذج اللغة الكبيرة دون الحاجة لمشاركة البيانات المحلية. لكن، أساليب LoRA التقليدية التي تم تصميمها للتعلم الفيدرالي تواجه صعوبات عديدة، تتعلق بتوازن كفاءة التواصل والدقة والأداء الحسابي، خصوصاً عند التعامل مع عملاء متنوعين.
بدلاً من الأساليب القديمة التي تعتمد على حساب المتوسطات البسيطة لملحقات محلية تخلق ضوضاء في التجميع، أو نقل ملحقات محلية ضخمة مما يقلل كفاءة التواصل، أو حتى الحاجة لإعادة بناء مصفوفة محدثة معقدة من الأوزان العالمية، يفتح FLoRIST آفاقاً جديدة من خلال استخدام طريقة متطورة.
باستخدام تحليل القيم المفردة (Singular Value Decomposition) لملحقات محلية بشكل منفصل، يحقق FLoRIST تجميعاً دقيقاً بطريقة فعالة. يتضمن ذلك استخدام عتبة قابلة للتعديل لاختيار الرتبة المثلى على جانب الخادم، مما ينتج عنه زوج من ملحقات منخفضة الرتبة يتم مشاركتها بين جميع العملاء.
تظهر التقييمات التجريبية على مجموعات بيانات متعددة أن FLoRIST يحقق توازناً ممتازاً بين كفاءة التواصل العالية والأداء التنافسي، سواء في البيئات المتماثلة أو المتنوعة. ينتظر مجتمع البحث العلمي بشغف كيف ستمكن هذه التطورات الجديدة من تحقيق إنجازات غير مسبوقة في علم الذكاء الاصطناعي.
FLoRIST: ثورة في تحسين النماذج اللغوية الكبيرة بكفاءة ودقة عالية!
تقدم FLoRIST إطاراً متطوراً لتحسين النماذج اللغوية الكبيرة بطريقة فعالة دون الحاجة لمشاركة البيانات المحلية. استطاعت FLoRIST تحقيق التوازن المثالي بين كفاءة التواصل ودقة الأداء عبر تجارب متعددة.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
