في عالم الذكاء الاصطناعي، تعتبر نماذج المعمارية التنبؤية المشتركة (Joint Embedding Predictive Architectures - JEPAs) خطوة متقدمة نحو تطوير نماذج عالمية قادرة على تمثيل البيانات في مساحات مختزلة. ومع ذلك، كانت الأساليب التقليدية تعاني من هشاشة كبيرة بسبب اعتمادها على فقدانات معقدة ومتعددة، وهو ما جعلها غير قادرة على العمل بفاعلية دون إشراف إضافي.
تقدم لنا LeWorldModel (LeWM) حلاً مبتكرًا، حيث يعد أول نموذج يحقق التعلم التنبؤي المباشر من الصور الخام بشكل يضمن الاستقرارية. يستخدم النموذج الجديد فقط خوارزميتين لفقدان المعلومات: واحدة لتوقع الارتباط المستقبلي، وأخرى تعمل كمنظم لتوزيع الارتباطات في الفضاء الكامن. هذا يعني تقليص عدد المتغيرات المرتبطة بفقدان البيانات من ستة إلى واحد، ما يزيد من كفاءة النموذج.
يستطيع LeWM التعلم بفعالية مع حوالي 15 مليون بارامتر (parameters) على وحدة معالجة رسومية واحدة في غضون ساعات، مما يجعله أسرع بـ48 مرة من النماذج العالمية الأساسية. كما أثبتت الاختبارات أن الفضاء الكامن للنموذج يخزن بنية فيزيائية ذات معنى، حيث يُظهر النموذج القدرة على الكشف عن الأحداث غير المنطقية فيزيائيًا.
LeWM يمثل طفرىً مهمة في مجال النماذج التنبؤية، حيث يقدم طريقة جديدة تجمع بين الكفاءة والأداء، مما يعد بآفاق جديدة في التطورات المستقبلية لتكنولوجيا الذكاء الاصطناعي.
إطلاق LeWorldModel: نموذج ثوري للتنبؤ المباشر بخصائص العالم من الصور!
تم الكشف عن LeWorldModel (LeWM)، أول نموذج تنبؤي يجمع بين القدرة على التعلم من الصور الخام بشكل مستقر وسريع. يتميز بكونه أقل تعقيدًا وأكثر كفاءة في التعامل مع المهام المختلفة.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
