في خطوة ثورية نحو تحسين أداء نماذج اللغة، تمثل عائلة داروين (Darwin Family) إطار عمل مبتكراً يتيح دمج نماذج اللغة الكبيرة بدون الحاجة إلى عملية تدريب. يعتمد هذا الإطار على إعادة تنظيم القدرات الكامنة في النماذج الموجودة بالفعل من خلال تقنية تسمى دمج الوزن (weight-space recombination) دون استخدام التدرجات.
تتضمن العائلة ثلاثة مفاهيم رئيسية:
1. **الجينوم التكيفي للدمج**: وهو جينوم بُعده 14 يتيح عملية دمج دقيقة على مستوى المكونات والكتل، مما يساهم في تحسين أداء النموذج بشكل شامل.
2. **دمج MRI-Trust**: توازن هذه التقنية بشكل ديناميكي بين إشارات أهمية الطبقات التشخيصية وعملية البحث التطورية، من خلال استخدام معلمة موثوقية قابلة للتعلم.
3. **الخريطة المعمارية**: تسمح بتربية النماذج عبر هياكل مختلفة بين عائلات النماذج غير المتجانسة.
من خلال هذه التطورات، حققت عائلة داروين نموذجها الرائد Darwin-27B-Opus نسبة 86.9% في اختبار GPQA Diamond، مما جعله يحتل المرتبة السادسة بين 1252 نموذج تم تقييمها، متفوقًا بذلك على نموذج القاعدة المدربة بالكامل دون الحاجة إلى التدريب القائم على التدرجات.
علاوة على ذلك، على مدى مقاييس تتراوح بين 4 مليار إلى 35 مليار معلمة، تُظهر نماذج داروين باستمرار تحسينات ملموسة مقارنةً بنماذجها الأصلية، مما يدعم عملية التطور متعددة الأجيال بشكل متكرر.
تؤكد عائلة داروين على أن الدمج التطوري القائم على التشخيص هو بديل عملي وقابل للتكرار لعمليات ما بعد التدريب المكلفة للنماذج ذات التركيز الاستنتاجي. هل أنتم متحمسون لهذه الابتكارات في عالم الذكاء الاصطناعي؟ شاركونا آرائكم في التعليقات!
عائلة داروين: ثورة دمج نماذج اللغة بدون تدريب لتحسين الأداء الاستنتاجي!
تقدم عائلة داروين إطاراً مبتكراً لدمج نماذج اللغة الكبيرة بلا تدريب، محققة نتائج مبهرة في الأداء الاستنتاجي. اكتشف كيف يمكن إعادة تنظيم القدرات الموجودة لتحقيق تحسينات دون الحاجة لتدريب جديد.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
