في عالم الذكاء الاصطناعي والطب، يعد ربط الكيانات البيولوجية عبر اللغات (Cross-lingual Biomedical Entity Linking) خطوة حاسمة تسهم في دعم التطبيقات السريرية وتطبيقات معالجة اللغة الطبيعية (NLP). اليوم، نقدم لكم التطور المذهل الذي تمثله دراسة جديدة تحمل عنوان "BioELX"، وهو إطار عمل مبتكر يهدف إلى تحسين دقة وكفاءة ربط الكيانات البيولوجية عبر اللغات دون الحاجة إلى مجموعات بيانات تدريب مكلفة.
تعتمد العديد من الأنظمة المتاحة حاليًا على نموذج "SapBERT" الذي تم تدريبه في الغالب على أسماء باللغة الإنجليزية، مما يؤدي إلى صعوبات كبيرة في الأداء مع الكيانات غير الإنجليزية. لكن BioELX يأتي بتقنية جديدة تعتمد على عدة مراحل لرفع مستوى الأداء: في المرحلة الأولى، يتم إثراء نموذج SapBERT بواسطة أسماء متعددة اللغات مستمدة من "Wikidata"، مما يعزز قدرته على استرجاع المرشحين من مختلف اللغات.
وفي المرحلة الثانية، يتم استخدام نموذج تصنيف مسبق التدريب (LLM) يقوم بفهم سياق الكيانات لتمييز بين الاختيارات المختلفة بذكاء، مما يلغي الحاجة إلى تدريب مُشرف للبيانات. وقد حققت التجارب التي أجريت على خمس معايير قياسية (مثل XL-BEL وEMEA وPatent وWikiMed-DE وMedMentions) نتائج غير مسبوقة، حيث زادت نسبة الاستعادة (Recall@1) على معيار XL-BEL بنسبة 19.2%، مع تحقيق تحسينات ملحوظة في اللغات ذات الموارد المحدودة مثل التركية والكورية والتايلاندية.
إن BioELX يمثل قفزة نوعية في ربط الكيانات البيولوجية عبر اللغات ويعكس مستقبلًا واعدًا في مجال معالجة البيانات البيولوجية متعددة اللغات.
هل أنتم متحمسون لمثل هذه الابتكارات في مجال الذكاء الاصطناعي والطب؟ شاركونا آراءكم في التعليقات!
اكتشاف ثوري: BioELX يربط الكيانات البيولوجية عبر اللغات دون الحاجة إلى بيانات تدريب معقدة!
أطلقت دراسة جديدة إطار عمل BioELX الذي يربط الكيانات البيولوجية عبر اللغات باستخدام تقنيات مبتكرة. يتميز بتحسين كبير في الأداء، خاصةً للغات ذات الموارد المحدودة.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
