في عالم الذكاء الاصطناعي، تمثل [نماذج](/tag/نماذج) [الشبكات التوليدية](/tag/[الشبكات](/tag/الشبكات)-التوليدية) (Generative [Models](/tag/models)) أحدث [الابتكارات](/tag/الابتكارات) في [تطوير](/tag/تطوير) [تقنيات [التعلم](/tag/التعلم) العميق](/tag/[تقنيات](/tag/تقنيات)-[التعلم](/tag/التعلم)-العميق). وقد أظهرت [الأبحاث](/tag/الأبحاث) الجديدة أن هناك طريقة فعالة، وقليلة التباين، لتدريب هذه النماذج، وهي خسارة متوسطة التربيع (Mean Square Error) بين [احتمالات](/tag/احتمالات) [نماذج الذكاء الاصطناعي](/tag/[نماذج](/tag/نماذج)-الذكاء-الاصطناعي) واختيارات الأهداف.
أثبتت النتائج أن هذه الخسارة، عند تقييمها باستخدام [بيانات](/tag/بيانات) على السياسة (On-policy), تعكس انحدارات [تقارب](/tag/تقارب) تباين Kullback-Leibler، بينما تظل فعالة أيضاً عند استخدام [بيانات](/tag/بيانات) خارج السياسة (Off-policy). الفكرة الأساسية هنا تكمن في توسيع هذا المفهوم ليستوعب مجموعة كاملة من التباينات $f$-divergences، مما يؤدي إلى مجموعة جديدة من الخسائر تعتمد على [خصائص](/tag/خصائص) هذه التباينات.
توضح [الأبحاث](/tag/الأبحاث) كيف أن انحدارات حالة السياسة على الاحتمالات المستهدفة ونماذج [الذكاء الاصطناعي](/tag/الذكاء-الاصطناعي) تعكس تباينات $f$، مما يتيح [تصميم](/tag/تصميم) [وظائف جديدة](/tag/[وظائف](/tag/وظائف)-جديدة) للخسارة تعزز من تغطية الأنماط في مجموعة واسعة من [نماذج](/tag/نماذج) [التوليد](/tag/التوليد).
تجري [التجارب](/tag/التجارب) على مهام متنوعة، بدءًا من أمثلة تركيبية تقليدية إلى [نماذج](/tag/نماذج) مثل SynFlowNets لاكتشاف الجزيئات، بالإضافة إلى ضبط [نماذج [اللغة](/tag/اللغة) الكبيرة](/tag/[نماذج](/tag/نماذج)-[اللغة](/tag/اللغة)-الكبيرة) (Large Language [Models](/tag/models)). تشير النتائج إلى أن [النماذج](/tag/النماذج) تحتفظ بخصائصها المتوقعة سواء من حيث [البيانات](/tag/البيانات) المستخدمة في [التدريب](/tag/التدريب) (على السياسة) أو من حيث [البيانات](/tag/البيانات) التي تم الحصول عليها بشكل غير منهجي (خارج السياسة).
هذا التحول في [فهم](/tag/فهم) كيفية استخدام الخسائر يعكس خطوة جديدة [نحو](/tag/نحو) تعزيز [نماذج](/tag/نماذج) الذكاء الاصطناعي، مما يفتح آفاقًا جديدة أمام [الباحثين](/tag/الباحثين) والمطورين في هذا المجال.
ما رأيكم في هذا التطور المثير؟ شاركونا في [التعليقات](/tag/التعليقات)!
اكتشافات جديدة في توازن مسار $f$: مجموعة خسائر ثورية لتعديل نماذج الذكاء الاصطناعي
تم الكشف عن أساليب مبتكرة في خسائر مسار $f$ لتعزيز فعالية نماذج الذكاء الاصطناعي باستخدام بيانات على وخارج السياسة. تقدم هذه النتائج أدوات جديدة لتعديل نماذج التوليد بطرق أكثر فعالية.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
