في مشهد [الذكاء الاصطناعي](/tag/الذكاء-الاصطناعي) الذي يتطور بسرعة، برزت [نماذج [الرؤية](/tag/الرؤية) واللغة](/tag/[نماذج](/tag/نماذج)-[الرؤية](/tag/الرؤية)-واللغة) (Vision-Language-Action [Models](/tag/models)) كأدوات قوية تعيد تشكيل طريقة تفاعلنا مع [البيانات](/tag/البيانات). وها هم الباحثون يقترحون ثورة جديدة تحت شعار RAW-Dream، التي تعد بوابة لعالم مثير من [التعلم المعزز](/tag/[التعلم](/tag/التعلم)-المعزز) ([Reinforcement Learning](/tag/reinforcement-learning)) الخالي من [القيود](/tag/القيود).
تتمثل المشكلة الرئيسية التي يواجهها مطورو [النماذج](/tag/النماذج) في اعتمادهم على [بيانات](/tag/بيانات) محددة للتكيف مع المهام الجديدة، مما يعوق [قابلية التوسع](/tag/قابلية-[التوسع](/tag/التوسع)) ويوجههم لتكاليف باهظة. ولكن مع RAW-Dream، تم تقديم [نموذج جديد](/tag/[نموذج](/tag/نموذج)-[جديد](/tag/جديد)) يتخلص من الاعتماد على المهام المحددة، من خلال [تمكين](/tag/تمكين) النموذج من [التعلم](/tag/التعلم) من أنشطة متنوعة دون [قيود](/tag/قيود) سابقة.
يتضمن هذا النهج نموذجاً عالياً للتوقع يعتمد على [سلوكيات](/tag/سلوكيات) متعددة المهام، ما يسمح للنموذج بالتنبؤ بالتطورات المستقبلية بشكل دقيق. وتم دمج ذلك مع [نموذج [رؤية](/tag/رؤية) ولغة](/tag/[نموذج](/tag/نموذج)-[رؤية](/tag/رؤية)-ولغة) مُعد سلفاً، لتوليد [المكافآت](/tag/المكافآت) بطريقة مبتكرة.
وبفضل هذا [الفصل](/tag/الفصل) بين [نموذج العالم](/tag/[نموذج](/tag/نموذج)-العالم) ومتطلبات المهام المختلفة، يمكن لهذا النظام [التعلم](/tag/التعلم) في وضع عدم الاتصال ([Zero](/tag/zero)-Shot) لأي مهمة جديدة، مما يجعله ثورياً في كيفية استجابة النموذج للتغيرات.
ولمواجهة الظواهر السلبية المحتملة مشخصات العالم، تم إدخال آلية [تحقق](/tag/تحقق) مزدوجة لتصفية التطورات غير الموثوقة. وقد أظهرت [التجارب](/tag/التجارب) التي أجريت في بيئات [محاكاة](/tag/محاكاة) وعالمية أداءً قوياً، مما يثبت أن الأنماط الفيزيائية العامة يمكنها أن تحل محل [البيانات](/tag/البيانات) المعتمدة على المهام بكفاءة عالية.
هل أنتم متحمسون لهذا [الابتكار](/tag/الابتكار) المذهل في عالم [الذكاء الاصطناعي](/tag/الذكاء-الاصطناعي)؟ شاركونا آراءكم في [التعليقات](/tag/التعليقات)!
اكتشاف التطور الثوري في نماذج الرؤية واللغة من خلال التعلم المعزز!
تمكن باحثون من تطوير نموذج RAW-Dream الذي يعيد تشكيل طرق التعلم في نماذج الرؤية واللغة من خلال التعلم المعزز. هذا الابتكار يعزز القدرة على التكيف مع المهام الجديدة دون الحاجة إلى بيانات مكلفة!
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
