في عصر الذكاء الاصطناعي، يعتبر تطوير أنظمة ذكاء اصطناعي عامة تحاكي الكفاءة البشرية في معالجة البيانات أحد أكبر التحديات التي تواجه الباحثين. تعد نماذج العالم (World Models) طريقاً واعداً نحو تحقيق هذا الهدف، ولكن العديد من الأبحاث الحالية تمزج بين الآليات المعمارية و تأثير حجم النموذج (Scale) المستقل. في دراستنا هذه، استخدمنا نموذج ترانسفورمر بسيط لتحليل سلوكيات الحجم باستخدام معيار آتاري 100k، مع الاعتماد على مجموعات بيانات ثابتة مستمدة من سياسة خبير مفترضة.
كشفت نتائجنا أن البيئات تخضع في الأساس لأنظمة حجم متميزة، حتى عندما يتم تقييدها بنفس ميزانيات البيانات القديمة وقدرات النموذج. بالنسبة للمهام الفردية، تسمح بعض البيئات للنماذج بتجاوز عتبة الاستيفاء، مما يؤدي إلى تحسن تدريجي في النظام الزائد المعتمد، بينما تبقى بيئات أخرى محاصرة في النظام الكلاسيكي، حيث يؤدي حجم أكبر لنماذج العالم إلى تدهور في الدقة.
في النظام الموحد، أي نموذج ترانسفورمر واحد مدرب على مجموعة متنوعة من 26 بيئة آتاري، اكتشفنا أن التدريب المشترك يعزز ديناميكيات الحجم، مما يضمن تحقيق مكاسب تدريجية عبر جميع البيئات، بغض النظر عن أنظمة الحجم الفريدة التي تتمتع بها.
أخيراً، تظهر نتائجنا أن تحسين الدقة يترجم مباشرة إلى التحكم الأقصى، حيث تحقق السياسات المتعلمة بالكامل ضمن الديناميكيات المحاكية درجة متوسطة تبلغ 0.770. تشير هذه الاكتشافات إلى أن التقدم المستقبلي يعتمد على استراتيجيات الحجم الدقيقة بقدر ما يعتمد على الابتكار المعماري.
استكشاف تأثير الحجم على نماذج العالم الترانسفورمر العامة لتحسين كفاءة البيانات في ألعاب آتاري
يعتبر تطوير أنظمة عامة تحتفظ بكفاءة بيانات قريبة من البشر تحدياً مركزياً. توضح نتائجنا كيف يؤثر الحجم على سلوك نماذج العالم الترانسفورمر في بيئات مختلفة.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
