في عصر الذكاء الاصطناعي، غالبًا ما يُنظر إلى النماذج على أنها كيانات مستقلة، يتم تدريبها لأغراض معينة واستبدالها عند ظهور نماذج محسنة. لكن ماذا لو كانت هناك طريقة لدمج هذه النماذج بطريقة تعزز من أدواتنا الذكية دون الحاجة إلى العودة إلى البيانات الأصلية؟
هذه التساؤلات تم تناولها بالفعل في دراسة حديثة تناولت مفهوم "دمج النماذج" (Model Merging)، وهو بديل مبتكر يهدف إلى دمج الشبكات العصبية المدربة بشكل مستقل مباشرة داخل فضاء الأوزان، مع الحد الأدنى من التحسينات.
تتناول هذه الدراسة حالتين رئيسيتين: الحالة الأولى هي الإعداد المخصص لمهمة واحدة، حيث تتشارك النماذج في هدف واحد لكنها تختلف في إعدادات البداية. هنا، تم تقديم خوارزمية C$^2$M$^3$، التي تعتمد على تحسين Frank-Wolfe. هذه الخوارزمية تعمل على مواءمة الشبكات المتعددة داخل فضاء مرجعي مشترك، مما يسمح بتقنية تجميع الأوزان بشكل ذكي دون تفضيل نموذج واحد.
الحالة الثانية تتعلق بإعداد المهام المتعددة، حيث يتم ضبط النماذج لمهام مختلفة من نفس الإعداد الأولي. طورت الدراسة مفهوم "متجهات المهام" كعنصر أساسي لفهم فعالية العمليات الحسابية بين المهام. وقد أظهرت النتائج أن هذه المتجهات يمكن أن ترث الهيكل منخفض الرتبة من التدرجات، مما أدي إلى إدخال مفهوم "متجهات فردية للمهام" (Task Singular Vectors - TSV) التي تمكن من ضغط البيانات وتقليل التداخل.
وفي سياق تحسين الكفاءة، تم تقديم طريقة MASS التي تعتمد على اختيار المساحات الفرعية الملائمة في وقت الاستدلال. بالإضافة إلى ذلك، فإن الإطار التطوري MERGE$^3$ الذي تم تقديمه يسعى إلى تقليل تكاليف التقييم بنسبة تصل إلى 50 مرة دون المساس بجودة الحلول.
تجمع هذه الإسهامات بين الأسس النظرية والخوارزمية لدمج النماذج، مكونةً طيفًا جديدًا يسمح بتجميع وإعادة استخدام وتوسيع القدرات المكتسبة عبر النماذج.
انضموا إلى النقاش حول كيف يمكن لهذه المفاهيم المبتكرة أن تغير مستقبل الذكاء الاصطناعي، وشاركوا معنا آراءكم حول هذا الابتكار المثير!
دمج النماذج: طرق مبتكرة لتعزيز قدرات الذكاء الاصطناعي
تستكشف هذه الدراسة مفهوم دمج النماذج كوسيلة جديدة لتحسين النماذج المدربة وتوحيد قدراتها دون الحاجة إلى البيانات الأصلية. من خلال أساليب كـ C$^2$M$^3$ وMASS، تقدم دراسة رائدة في هذا المجال.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
