تعد عملية استخراج العلاقات الحيوية (BioRE) خطوة حيوية لتحويل الأدب الطبي إلى معرفة منظمة، ولكن الطرق التقليدية تعتمد بشكل كبير على النماذج المشرفة التي تتطلب مجموعات بيانات مكلفة ومشروطة، مما يقيد قابلية التوسع والتكيف عبر أنواع العلاقات والمجالات. في دراسة حديثة، تم التحقيق في تقنية استخراج العلاقات الحيوية باستخدام التعلم القائم على النماذج اللغوية الضخمة (LLMs) مع تركيز خاص على التعلم من خلال اللقطات القليلة (Few-Shot Learning).
تتناول الدراسة نوعين من الصيغ العملياتية: التصنيف ثنائي التفاعل، الذي يتنبأ بالعلاقات بين أزواج الكيانات الفردية، وعمليات التوليد المشترك، التي تستخرج عدة علاقات في استدعاء واحد للنموذج. أظهرت التجارب على مجموعة بيانات BioREDirect توازنًا واضحًا بين الدقة والاسترجاع. حيث أن التصنيف ثنائي التفاعل حقق استرجاعًا أعلى، بينما كانت عمليات التوليد المشترك أكثر دقة وكفاءة من ناحية الحساب.
أدى أفضل نموذج إلى تحقيق درجة ميكرو-F1 تبلغ 0.44، مما يتفوق بشكل ملحوظ على نتائج التعلم القليل السابقة (0.34)، رغم بقاءه دون خط القاعدة للتعلم المشرف (0.56). يعزى جزء كبير من هذه الفجوة إلى نوع علاقة واحد تم تعريفه بشكل غامض. عند تقييم الأداء باستخدام المقياس ماكرو-F1، الذي يعكس الأداء عبر أنواع العلاقات في بيئة غير متوازنة بشكل أفضل، تفوقت الأساليب القائمة على النماذج اللغوية الضخمة على خط القاعدة للتعلم المشرف (0.45 مقابل 0.38)، خاصة فيما يتعلق بأنواع العلاقات النادرة.
تؤكد هذه النتائج على إمكانات نماذج اللغات الضخمة لاستخراج العلاقات الحيوية في البيئات ذات الموارد المحدودة وتبرز أهمية تحديد مخططات العلاقات بشكل واضح.
اكتشاف العلاقات الحيوية: هل يمكن لنماذج اللغات الضخمة أن تكون البديل الأمثل للتعلم المشرف؟
توفر نماذج اللغات الضخمة طريقة مثيرة للاهتمام لاستخراج العلاقات الحيوية دون الاعتماد على مجموعة بيانات مشروطة ومكلفة. نتائج البحث تشير إلى إمكانيات واعدة لهذه النماذج في بيئات ذات موارد محدودة.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
