في عالم التعلم الآلي، يعتمد النجاح ليس فقط على كيفية نمذجة البيانات ولكن أيضًا على نوع البيانات التي يتم جمعها. لقد أحدثت نماذج التسلسل الكبيرة (Large Sequence Models) ثورة في كيفية معالجة البيانات، ولكن تبقى مشكلة اختيار البيانات الآلية أو ما يسمى 'فضول داخلي' (Intrinsic Curiosity) تحديًا كبيرًا.
تعمل الطرق التقليدية على تحفيز الاستكشاف من خلال مكافأة الوكلاء بناءً على "تقدم التعلم"، والذي يقيس مدى تحسن القدرة التنبؤية للنموذج بناءً على ملاحظات جديدة. إلا أن تقييم هذه المكافآت عادة ما يتطلب عمليات حسابة مكلفة، مما يجعلها غير قابلة للتطبيق على نطاق واسع.
في بحثنا الجديد، نستكشف ما إذا كانت قدرات التعلم في السياق (In-Context Learning) يمكن أن تعالج هذه المشكلة من خلال عملها كنماذج عالمية دون الحاجة للتحديثات المعقدة. نحن نقيّم إمكانية تدريب سياسة استكشاف تهدف لتعظيم تقدم التعلم باستخدام فقط أخطاء التنبؤ والتعديلات السلبية على سياق المعلم.
لقد أثبتنا أنه ضمن العمليات المعقدة، لا يمكن تحقيق ذلك بشكل غير متحيز. لكننا حصلنا على نتائج إيجابية في إعدادات غير زمنية تشير إلى أن مكافآت مستندة إلى التعلم في السياق قادرة على التقييد والتقارب asymptotically إلى تقدم التعلم الحقيقي.
تأكدنا من فرضياتنا من خلال تجارب محكومة عبر بيئات مستمرة ورمزية، مما يظهر أن إطار عملنا المدفوع بالتعلم في السياق قادر على تدريب سياسات جمع بيانات فضولية تستكشف بفعالية.
بفضل هذه التطورات، يمكن أن يمثل البحث خطوة مهمة نحو تحسين طرق جمع البيانات وتعزيز فعالية نظم الذكاء الاصطناعي في المستقبل.
هل يمكن أن تدعم التعلم في السياق فضول الذكاء الاصطناعي؟
تعتبر قضية اختيار البيانات الآلية، المعروفة باسم 'فضول داخلي'، تحديًا كبيرًا في مجال التعلم الآلي. هذا البحث يستكشف كيف يمكن لنماذج التعلم في السياق (In-Context Learning) التغلب على هذه التحديات وتعزيز استكشاف البيانات.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
