في عالم الذكاء الاصطناعي، تظل [آليات](/tag/آليات) [التعميم](/tag/التعميم) خارج النطاق (Out-Of-Distribution - OOD) واحدة من أكبر التحديات التي تواجه [الباحثين](/tag/الباحثين). يعتمد هذا المقال على [دراسة](/tag/دراسة) تقدم تحليلاً عميقًا باستخدام [نظرية](/tag/نظرية) [القياس](/tag/القياس) وكيفية تطبيقها على [نماذج [اللغات](/tag/اللغات) الضخمة](/tag/[نماذج](/tag/نماذج)-[اللغات](/tag/اللغات)-الضخمة) (Large Language [Models](/tag/models) - [LLM](/tag/llm)).
تركز [الدراسة](/tag/الدراسة) على كيفية [استنتاج](/tag/استنتاج) [المعلومات](/tag/المعلومات) من [أنظمة معقدة](/tag/[أنظمة](/tag/أنظمة)-معقدة) باستخدام [تقنيات](/tag/تقنيات) [رياضية](/tag/رياضية) مثل [النقل الأمثل](/tag/[النقل](/tag/النقل)-الأمثل) (Optimal Transport). تستند الفرضيات إلى مبدأ [قياس](/tag/قياس) التغيرات بين المجالات باستخدام مسافة وارسشتاين (Wasserstein-1 Distance). من خلال الاستناد إلى ثنائية كانتورفيتش (Kantorovich Duality)، تم وضع حدود على [التعميم](/tag/التعميم) خارج النطاق اعتمادًا على استمرارية ليبشيتز [المعمارية](/tag/المعمارية) (Architectural Lipschitz Continuity) وحدود التقريب الوظيفية.
تعرض النتائج قيودًا رئيسية تؤثر على [أداء](/tag/أداء) [النماذج](/tag/النماذج) في السيناريوهات المعقدة. أولاً، [آليات](/tag/آليات) [الانتباه](/tag/الانتباه) المعتمد على الموضع مثل [التشفير](/tag/التشفير) المطلق للموضع (Absolute Positional Encoding) تفتقر إلى الحفاظ على ثبات التحول، مما يؤدي إلى خطر مرتفع في [الأداء](/tag/الأداء). بالمقابل، الآليات الثابتة التحول (Shift-Invariant Mechanisms) مثل التشفيرات الدائرية (Rotary Embeddings) تحتفظ بدرجات من الثبات وتقيد الخطأ.
علاوة على ذلك، من خلال ربط التعقب التسلسلي بلغة ديك-$k$ (Dyck-$k$ Language)، تم تحديد حد أدنى صارم لعمق الدائرة يمكن تحقيقه لـ [Transformers](/tag/transformers) في فئة TC^0. يُعتبر زيادة عمق الطبقات الفيزيائية أمرًا ضروريًا لتفادي انهيار التمثيل، وهو أمر لا يمكن تجاوزه من خلال زيادة عرض [التمثيل](/tag/التمثيل) بسبب حدود الاقتراب غير القابلة للتقليل في مساحات بارون (Barron [Spaces](/tag/spaces)).
تثبت [التقييمات](/tag/التقييمات) التي أجريت [عبر](/tag/عبر) 54 تكوينًا من [Transformers](/tag/transformers) في [سياقات](/tag/سياقات) [البحث](/tag/البحث) التوافقي هذه الحدود، مما يظهر أن خطر [التعميم](/tag/التعميم) ينخفض بانتظام مع [تحولات](/tag/تحولات) مجال وارسشتاين.
إن هذا [البحث](/tag/البحث) يفتح الأبواب أمام استكشافات جديدة في كيفية [تحسين](/tag/تحسين) [نماذج الذكاء الاصطناعي](/tag/[نماذج](/tag/نماذج)-الذكاء-الاصطناعي) وجعلها أكثر فعالية في التعامل مع [البيانات المعقدة](/tag/[البيانات](/tag/البيانات)-المعقدة).
ما رأيكم في هذه الاكتشافات المثيرة؟ شاركونا في [التعليقات](/tag/التعليقات)!
تحليل نظرية القياس في التفكير: حدود التقريب والتعميم الهيكلي
تقدم الدراسة الجديدة نظرة عميقة على آليات التفكير في نماذج الذكاء الاصطناعي، مسلطة الضوء على حدود التعميم أثناء التغير في النطاقات. باستخدام نظريات رياضية متقدمة، تكشف الأبحاث عن قيود هامة تؤثر على قدرة النماذج على التكيف مع الحالات الجديدة.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
