في عصر تتسارع فيه الابتكارات في مجال الذكاء الاصطناعي، تبرز تقنية الشبكات الجيلية (Generative Flow Networks - GFlowNets) كلاعب رئيسي في مجالات مثل التعلم الآلي والبيانات الكبيرة. تعتبر GFlowNets فعالة في تخيُّل نماذج متنوعة وعالية المكافأة. لكن، تبرز تحديات كبيرة عندما يتعلق الأمر بتدريب هذه النماذج باستخدام مجموعات بيانات غير متصلة، خاصةً في تطبيقات تتطلب استجابات نشطة للمكافآت.
تقليدياً، يتم الاعتماد على نماذج ذات أهداف غير مباشرة (proxy models) لتقديم تعليقات حول المكافآت عبر مسارات تم أخذ عينات منها. بيد أن إنشاء نموذج موثوق يمكن أن يكون عملية صعبة، نظراً لندرة البيانات أو تكاليف التقييم المرتفعة. بالرغم من محاولات عدة لتطبيق طرق لا تتطلب وكيل، فإن هذه الطرق غالباً ما تفرض قيودًا كبيرة تعيق فعالية عملية الاستكشاف.
لحل هذه المشاكل، نقدم إطار تدريب مبتكر يطلق عليه "GFlowNet المُقطر من المسارات" (Trajectory-Distilled GFlowNet - TD-GFN). تعتمد TD-GFN على تقنية التعلم بالتعزيز العكسي (Inverse Reinforcement Learning - IRL) لاستخراج مكافآت واهية بدقة من المسارات غير المتصلة، مما يوفر توجيهًا هيكليًا غنيًا لاستكشاف أكثر كفاءة.
المكون الأهم في تصميم TD-GFN هو أنها تضمن قوة استكشافها من خلال توجيه المكافآت بشكل غير مباشر عبر تقليم الرسوم البيانية (DAG pruning) وعينة العودة المتقدمة (prioritized backward sampling). هذا التصميم يضمن أن تحديثات التدرج تعتمد فقط على مكافآت النهاية الحقيقية من مجموعة البيانات، مما يمنع انتشار الأخطاء.
أظهرت النتائج العملية أن TD-GFN يتفوق بشكل كبير على مجموعة واسعة من القياسات الأساسية في سرعة التقارب وجودة العينات، مما يساهم في إقامة نموذج أكثر قوة وكفاءة لتدريب GFlowNet غير المتصل.
تجاوز المعوقات: توجيه مبتكر لتدريب GFlowNet غير المتصل
تقدم تقنية TD-GFN إطاراً تدريبياً طموحاً لتطوير الشبكات الجيلية، مُعزّزاً بطرق متطورة لاستخراج المكافآت. هذا التوجه الجديد يساهم في تحسين فعالية التدريب باستخدام بيانات غير متصلة، مما يفتح آفاقاً جديدة في هذا المجال.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
