في عالم التعلم الآلي متعدد النماذج (Multimodal Machine Learning)، تواجه التطبيقات في الحياة الواقعية تحديات متعددة، أبرزها فقدان بعض النماذج وارتفاع تكلفة اكتسابها. ومن هنا، يبرز السؤال المحوري: كيف يمكن اختيار العينات الأكثر أولوية للاستحواذ على بيانات إضافية ضمن ميزانية محددة؟
قدّمت الأبحاث السابقة تركيزاً كبيراً على استراتيجيات اكتساب البيانات على مستوى العينة أو وقت التدريب، فيما تم إهمال جانب الاكتساب على مستوى المجموعة في وقت الاختبار. وفي هذا السياق، أطلق الباحثون تقنية جديدة تحت مسمى "اكتساب بيانات النماذج النشطة المعتمدة على المجموعات" (Cohort-based Active Modality Acquisition - CAMA)، التي تمثل إعداداً مبتكراً لاكتساب البيانات في وقت الاختبار.
تقوم تقنية CAMA على استراتيجيات استيفاء البيانات، للاستدلال على الفائدة المتوقعة من اكتساب نموذج مفقود. تعتمد هذه الاستراتيجيات على أساليب إرشادية مفيدة بالإضافة إلى حدود عُلوية لتسهيل المقارنة والتقييم. وقد أثبتت التجارب على مجموعات بيانات تضم حتى 15 نموذجاً أن الأساليب المقترحة فعّالة بشكل أكبر في توجيه استحواذ نموذج إضافي لعينات مختارة، مقارنة بالأساليب التي تعتمد فقط على المعلومات المسبقة أو الإرشادات المستندة إلى احتمالية المعلومات.
ما يميز هذه الدراسة هو قدرتها على توظيف هذه الأساليب في تجارب العالم الحقيقي، حيث أثبتت فعالية توجيه اكتساب بيانات البروتيوميات (Proteomics Data) في التنبؤ بالأمراض من خلال مختبرات طبية كبيرة مثل بنك الأبحاث البريطاني (UK Biobank).
ختامًا، توفر هذه الدراسة نهجًا فعالًا لتحسين اكتساب البيانات على مستوى المجموعة، مما يسهل الاستخدام الأمثل للموارد في بيئات محدودة، ويُمثل خطوة هامة نحو تطوير أدوات ذكاء اصطناعي أكثر كفاءة وتعقيدًا.
تحقيق إنجازات جديدة في اكتساب بيانات النماذج المتعددة: أساليب مبتكرة لتحسين استغلال الموارد!
تقدم الدراسة طريقة جديدة لاكتساب البيانات المفقودة في التعلم الآلي متعدد النماذج، مما يساعد على تحسين فعالية الموارد. هذا الابتكار يفتح آفاقاً جديدة لطرق التنبؤ بالمرض باستخدام بيانات تجريبية من أبحاث واسعة.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
