في عالم الذكاء الاصطناعي، تُعتبر النماذج القائمة على المحولات (Transformers) من الركائز الأساسية لتطوير أنظمة ذكية يمكنها التعامل مع مختلف المهام اللغوية بكفاءة. بينما تقدم نماذج الم_encoder-decoder فوائد كبيرة من حيث توفير الوقت أثناء الاستدلال، إلا أن الأهداف التدريبية لها تعاني من ضعف الإشراف الديناميكي وأطوال التسلسل المتغيرة، مما يحد من فعالية هذه النماذج عند تطبيقها على نطاق واسع.
لذا، جاء الباحثون بفكرة جديدة مُبتكرة تُسمى "الم_decoder الثنائي القائم على الكتل" (Block-Based Double Decoders)، وهي معمارية محول جديدة تستخدم أقنعة الانتباه القائم على الكتل لدعم التدريب بإشراف كامل وتعبئة تسلسلات ثابتة. إن هذه التقنية تعد بتقديم كفاءة تدريب عالية تتمثل في مزايا النماذج المكونة من الم_الم_decoder فقط مع الحفاظ على كفاءة استدلال الم_encoder-decoder.
أظهرت التجارب المتعلقة بقوانين التوسع أن الأنظمة الجديدة outperform (تتفوق) على النماذج التقليدية القائمة على الم_encoder-decoder وبقوة تتشابه مع النماذج المبنية على الم_decoder فقط عبر مختلف المقاييس. بشكل مثير، في وقت الاستدلال، تعمل هذه النماذج على تقليص استهلاك الذاكرة وحساب كل توكن بمعدل يصل إلى ثلثين، دون التضحية بميزات تخزين البيانات المسبقة أو أي تحسينات استدلالية تعتمد عليها النماذج المكونة من الم_decoder فقط.
هذه التطورات تعيد رسم ملامح أداء تقنيات الذكاء الاصطناعي وتثير تساؤلات مهمة عن مستقبلها. فما الذي ينتظرنا بعد؟
ثورة جديدة في تصميم النماذج: الم_decoder الثنائي القائم على الكتل!
تقدم البحوث الجديدة ثورة في تصميم النماذج عبر تقديم مفهوم النماذج ذات الم_decode_ الثنائي القائم على الكتل، الذي يعد بتحسين كبير في الكفاءة. هذه التقنية الجديدة تفوق النماذج التقليدية بشكل ملحوظ، مما يمهد الطريق لمستقبل واعد في الذكاء الاصطناعي.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
