في عالم الذكاء الاصطناعي، تمثل نماذج الشبكات التوليدية (Generative Models) أحدث الابتكارات في تطوير تقنيات التعلم العميق. وقد أظهرت الأبحاث الجديدة أن هناك طريقة فعالة، وقليلة التباين، لتدريب هذه النماذج، وهي خسارة متوسطة التربيع (Mean Square Error) بين احتمالات نماذج الذكاء الاصطناعي واختيارات الأهداف.
أثبتت النتائج أن هذه الخسارة، عند تقييمها باستخدام بيانات على السياسة (On-policy), تعكس انحدارات تقارب تباين Kullback-Leibler، بينما تظل فعالة أيضاً عند استخدام بيانات خارج السياسة (Off-policy). الفكرة الأساسية هنا تكمن في توسيع هذا المفهوم ليستوعب مجموعة كاملة من التباينات $f$-divergences، مما يؤدي إلى مجموعة جديدة من الخسائر تعتمد على خصائص هذه التباينات.
توضح الأبحاث كيف أن انحدارات حالة السياسة على الاحتمالات المستهدفة ونماذج الذكاء الاصطناعي تعكس تباينات $f$، مما يتيح تصميم وظائف جديدة للخسارة تعزز من تغطية الأنماط في مجموعة واسعة من نماذج التوليد.
تجري التجارب على مهام متنوعة، بدءًا من أمثلة تركيبية تقليدية إلى نماذج مثل SynFlowNets لاكتشاف الجزيئات، بالإضافة إلى ضبط نماذج اللغة الكبيرة (Large Language Models). تشير النتائج إلى أن النماذج تحتفظ بخصائصها المتوقعة سواء من حيث البيانات المستخدمة في التدريب (على السياسة) أو من حيث البيانات التي تم الحصول عليها بشكل غير منهجي (خارج السياسة).
هذا التحول في فهم كيفية استخدام الخسائر يعكس خطوة جديدة نحو تعزيز نماذج الذكاء الاصطناعي، مما يفتح آفاقًا جديدة أمام الباحثين والمطورين في هذا المجال.
ما رأيكم في هذا التطور المثير؟ شاركونا في التعليقات!
اكتشافات جديدة في توازن مسار $f$: مجموعة خسائر ثورية لتعديل نماذج الذكاء الاصطناعي
تم الكشف عن أساليب مبتكرة في خسائر مسار $f$ لتعزيز فعالية نماذج الذكاء الاصطناعي باستخدام بيانات على وخارج السياسة. تقدم هذه النتائج أدوات جديدة لتعديل نماذج التوليد بطرق أكثر فعالية.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
