في عالم الذكاء الاصطناعي، يكشف بحث جديد عن طريقة غير تقليدية يستفيد بها الأطفال من تجاربهم في تعلم اللغة. حيث تتجاوز قدرة الأطفال الفطرية نموذج الحوسبة الحالي المعتمد على البيانات المُنظّمة. هذه الدراسة الرائدة تسلط الضوء على
مشكلة كبيرة: تظهر الأبحاث أن نماذج اللغة والرؤية (Vision-Language Models) المعتمدة على البيانات المُنسقة لا تُظهر الكفاءة اللازمة لتعميم التعلم على البيانات الطبيعية القابلة للمشاهدة من وجهة نظر الأطفال. وبالتالي، تمثل البيانات المتنقلة التي يتم التقاطها بواسطة أجهزة التصوير المحمولة والتجارب في بيئات طفلية تحديًا كبيرًا للنماذج الحالية.
للتغلب على هذه العقبة، قام العلماء بتدريب نماذج متعددة الأبعاد تعتمد على أنواع مختلفة من البيانات، بما في ذلك مقاطع الفيديو الطبيعية للأطفال والبالغين. تم تقييم هذه النماذج من خلال مجموعة شاملة تشمل مهام متعلقة باللغة والرؤية. في قلب هذا التقييم يقف معيار Machine-DevBench، الذي يُعتمد عليه لتقييم الكفاءة اللغوية والنحوية، حيث يساعد في تقليل الفجوة بين التدريب والتقييم.
تشير النتائج إلى أن النماذج الحالية تحتاج بشدة إلى التنسيق الدقيق للبيانات المنسقة، حيث كانت النتائج غير فعالة عند التعامل مع إشارات ضعيفة التوافق، وهي وضعية يُعتبر البشر فيها الأكثر نجاحًا.
لتحفيز التقدم في هذا المجال، تم الاعلان عن تحدي EgoBabyVLM، الذي يهدف لتطوير نماذج قادرة على التعلم اللغوي المستند إلى البيانات الطبيعية التي يختبرها الأطفال، مما يعد خطوة مهمة نحو تحسين أداء نماذج الذكاء الاصطناعي.
هذا البحث يمثل بداية جديدة لفهم أعمق لكيفية التعلم من البيانات الطبيعية، فهل نحن على أعتاب ثورة في نماذج الذكاء الاصطناعي؟ ما رأيكم في هذا التطور؟ شاركونا في التعليقات.
تحدي EgoBabyVLM: ثورة في تعلم اللغة من بيانات الفيديو الطبيعية
تقدم دراسة جديدة نماذج فريدة لاستكشاف كيفية تعلم الأطفال للغة من بيانات الفيديو الطبيعية، متجاوزةً أفضل النماذج الحالية. بالتزامن مع إطلاق تحدي EgoBabyVLM، يُتوقع تطورًا ملحوظًا في مجال الذكاء الاصطناعي.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
