في عالم الذكاء الاصطناعي، تعد [نماذج العالم](/tag/[نماذج](/tag/نماذج)-العالم) ([World Models](/tag/world-models)) من التقنيات التي تشكل حجر الزاوية في [تطبيقات](/tag/تطبيقات) [التعلم التعزيزي](/tag/[التعلم](/tag/التعلم)-التعزيزي) ([Reinforcement Learning](/tag/reinforcement-learning)). لكن، هل لاحظتم أن هذه [النماذج](/tag/النماذج) غالباً ما تعاني من مشاكل مثل التكرار الزمني (Temporal Inconsistency)، مثل تكرار الكائنات واختفائها أو تغيّر شكلها؟
تظهر [الأبحاث الحديثة](/tag/[الأبحاث](/tag/الأبحاث)-الحديثة) التي تم تقديمها على [منصة](/tag/منصة) arXiv، كيف [تمكن](/tag/تمكن) الباحثون من صياغة توقع الإطار التالي (Next-Frame Prediction) كمشكلة [استدلال](/tag/استدلال) احتمالي منظم، وذلك [عبر](/tag/عبر) إدخال متغيرات للتواصل بين الرموز [عبر](/tag/عبر) الزمن (Token Correspondence). هذه الطريقة الجديدة التي تعتمد على [نماذج التحويل](/tag/[نماذج](/tag/نماذج)-التحويل) ([Transformer](/tag/transformer)-based [Models](/tag/models)) توفر منطقًا يتيح لكل رمز في إطار التالي إما أن يُنسخ من إطار سابق أو يتم توليده كرمز [جديد](/tag/جديد).
[نتائج التجارب](/tag/نتائج-[التجارب](/tag/التجارب)) التي أجريت على [تقنيات](/tag/تقنيات) جديدة، أظهرت أداءً متفوقًا على أربعة [معايير](/tag/معايير) تحدي، محققة نتائج مذهلة في اختبار Craftax-classic - حيث وصلت النسبة إلى 72.5% وأفضلت هدفاً قدره 35.6%، متفوقة بذلك على الأرقام السابقة التي كانت 67.4% و 27.9% على التوالي.
هذا [البحث](/tag/البحث) يمنح آفاقًا جديدة لإمكانيات [نماذج](/tag/نماذج) العالم، ليعزز بشكل كبير القدرة على التعامل مع مراحل [التعلم](/tag/التعلم) الطويلة. إذا كنت من المهتمين بمجال الذكاء الاصطناعي، لا تفوت فرصة الاطلاع على [الكود](/tag/الكود) المصدري المتاح [هنا](https://github.com/snu-mllab/Identifiable-Token-Correspondence)!
هل أنتم مستعدون لاكتشاف [أداء](/tag/أداء) هذه [النماذج](/tag/النماذج) وتحسينات [الذكاء الاصطناعي](/tag/الذكاء-الاصطناعي) المستقبلية؟ شاركونا آرائكم في [التعليقات](/tag/التعليقات)!
ثورة في نماذج العالم: كيف تغير تقنيات التشفير الأداء في التعلم التعزيزي!
تمثل تقنية التشفير القابلة للتعرف طفرة مهمة في نماذج العالم القائمة على التحويل، مما يسهم في تحسين الأداء على طول الفترة الزمنية. أنظمة التعلم التعزيزي لديك الآن مستويات جديدة من الدقة والفعالية!
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
