في السنوات الأخيرة، حققت [تقنيات](/tag/تقنيات) [تحويل النص](/tag/[تحويل](/tag/تحويل)-النص) إلى [صورة](/tag/صورة) ([Text-to-Image](/tag/text-to-image)) تقدماً مذهلاً، مما فتح آفاق جديدة في عالم [الذكاء الاصطناعي](/tag/الذكاء-الاصطناعي). لقد جذبت طرق التعزيز [الانتباه](/tag/الانتباه) بشكل واسع، خصوصاً الأساليب القائمة على [تحسين](/tag/تحسين) [سياسة](/tag/سياسة) [المجموعات](/tag/المجموعات) النسبية (Group Relative [Policy Optimization](/tag/policy-optimization) - [GRPO](/tag/grpo)) والتي تم تطبيقها بنجاح في مهام [تحويل النص](/tag/[تحويل](/tag/تحويل)-النص) إلى [صورة](/tag/صورة).
ومع ذلك، فإن [استراتيجية](/tag/استراتيجية) [أخذ العينات](/tag/أخذ-العينات) الموحدة التي تُستخدم عادة خلال [التدريب](/tag/التدريب) غالباً ما تغفل عن [التوافق](/tag/التوافق) بين صعوبة العينة وقدرة النموذج الحالية على التعلم، مما يؤدي إلى انخفاض [كفاءة التدريب](/tag/[كفاءة](/tag/كفاءة)-[التدريب](/tag/التدريب)). واعتمد الباحثون على فكرة أن [تحسين](/tag/تحسين) [كفاءة التدريب](/tag/[كفاءة](/tag/كفاءة)-[التدريب](/tag/التدريب)) يتطلب التركيز المستمر على النصوص التي تتوافق مع القدرات المتطورة للنموذج وتظل سهلة [التعلم](/tag/التعلم).
لتنفيذ ذلك، يُقترح إطار [عمل](/tag/عمل) وهو [تحسين](/tag/تحسين) [سياسة المناهج التعليمية](/tag/[سياسة](/tag/سياسة)-المناهج-التعليمية) المتكيفة (Curriculum Group [Policy Optimization](/tag/policy-optimization) - CGPO). أثناء التدريب، يُنتج كل [نص](/tag/نص) مجموعة من [الصور](/tag/الصور) التي تُقيّم بواسطة [نموذج المكافأة](/tag/[نموذج](/tag/نموذج)-المكافأة). يُستخدم تباين [المكافآت](/tag/المكافآت) الجماعية كمعيار [عبر](/tag/عبر) الإنترنت لعدم [التناسق](/tag/التناسق) في النصوص. يشير [التباين](/tag/التباين) العالي إلى أن النموذج قد استوعب جزئياً متطلبات النص، لكنه لم يُحقق بعد إتقاناً مستقراً. مثل هذه النصوص تُعد الأكثر قدرة على تقديم [إشارات](/tag/إشارات) [تعلم](/tag/تعلم) مفيدة، لذا نقوم بزيادة [احتمالات](/tag/احتمالات) أخذ عينات منها بناءً على ذلك.
علاوة على ذلك، لمعالجة عدم التوازن في [البيانات](/tag/البيانات) ضمن [مجموعات بيانات](/tag/مجموعات-[بيانات](/tag/بيانات)) متعددة الفئات، تم [تصميم](/tag/تصميم) طريقة [معايرة](/tag/معايرة) فئوية تعتمد على [تحسين](/tag/تحسين) [العدالة](/tag/العدالة) النسبية، والتي توازن صعوبة [التدريب](/tag/التدريب) [عبر](/tag/عبر) الفئات المختلفة.
تظهر [التجارب](/tag/التجارب) على GenEval وT2I-CompBench++ وDPG Bench أن [إطار العمل](/tag/إطار-العمل) الخاص بنا يحسن بشكل فعّال [أداء](/tag/أداء) التوليد، مما يعكس [نجاح](/tag/نجاح) هذا المنهج الجديد في تعزيز [كفاءة](/tag/كفاءة) [تقنيات الذكاء الاصطناعي](/tag/[تقنيات](/tag/تقنيات)-الذكاء-الاصطناعي) الحديثة.
تحسين سياسة المناهج التعليمية: استراتيجية جديدة لتعزيز إمكانيات تحويل النص إلى صورة
تشهد تقنيات تحويل النص إلى صورة (Text-to-Image) تطوراً ملحوظاً بفضل استراتيجيات جديدة في التدريب. تقدم دراسة حديثة إطار عمل مبتكراً يهدف إلى تحسين كفاءة التدريب باستخدام سياسة المناهج التعليمية المتطورة.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
