في عالم الذكاء الاصطناعي، تُعتبر [التحويلات](/tag/التحويلات) ([Transformers](/tag/transformers)) من [الابتكارات](/tag/الابتكارات) الرائدة التي أُعيدت صياغتها لتحسين فهمنا لكيفية استيعاب الأنظمة التعليمية للبيانات. في دراستنا الأخيرة، قمنا باستكشاف [سلوك](/tag/سلوك) [التحويلات](/tag/التحويلات) في التعامل مع المجالات البولينية وكيف يمكن لنظرية PAC-Bayes أن تقدم [رؤية](/tag/رؤية) جديدة لتحسين قدرة هذه الأنظمة على [التعميم](/tag/التعميم).
على عكس [أعمال](/tag/أعمال) سابقة مثل [دراسة](/tag/دراسة) (Edelman et al., 2022) و(Trauger and Tewari, 2024)، التي اعتمدت على تعقيد راديماتشر (Rademacher Complexity) لتحديد حدود التعميم، سعت دراستنا إلى استخدام [نظرية PAC-Bayes](/tag/[نظرية](/tag/نظرية)-pac-bayes) كأداة لقياس إمكانية [التعميم](/tag/التعميم).
ما وجدناه هو أن [الأطياف](/tag/الأطياف) القليلة المُركزة على عناصر منخفضة الدرجة تتيح [بناء](/tag/بناء) [نماذج](/tag/نماذج) ذات حدة منخفضة وخصائص [تعميم](/tag/تعميم) جيدة. وقد اقترحنا أن وجود الأدنى المسطح (Flat Minima) يمكن أن ينفذ أي وظيفة بولينية مع مستوى من الندرة لا يزيد عن طول السياق، مما يؤدي إلى استخدام حد PAC-Bayes على متعلم ذات حدة منخفضة مثالية، مما ينتج عنه حد [تعميم](/tag/تعميم) غير فارغ.
لم نتوقف عند الجانب النظري فقط، بل قمنا أيضًا بإجراء [تجارب](/tag/تجارب) تجريبية لدعم توقعاتنا، مع [دراسة](/tag/دراسة) للتفسير الآلي لتعزيز واقعية نموذجنا النظري في [التحويلات](/tag/التحويلات) الحقيقية. هذه النتائج يمكن أن تُحدث فارقًا في كيفية [تصميم أنظمة](/tag/[تصميم](/tag/تصميم)-[أنظمة](/tag/أنظمة)) [الذكاء الاصطناعي](/tag/الذكاء-الاصطناعي) وتحسين قدراتها في [إدراك](/tag/إدراك) الأنماط واستنتاج [البيانات](/tag/البيانات).
ما رأيكم في هذا التطور المذهل؟ شاركونا في [التعليقات](/tag/التعليقات)!
ثورة في فهم قدرة التحويلات: كيف تؤثر النظرية على العمق العام؟
تسلط دراستنا الضوء على سلوك التحويلات (Transformers) في تحقيق التعميم الجيد في المجالات البولينية. من خلال النظر في طيف فورييه (Fourier Spectra) لوظائفها المستهدفة، نقدم إطارًا نظريًا جديدًا يستند إلى نظرية PAC-Bayes.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
