تعتبر تعرف الكيانات المالية (Financial Named-Entity Recognition) أداة حيوية لتحويل التقارير المالية غير المنظمة إلى رسوم بيانية معرفية منظمة. ومع ذلك، تواجه النماذج اللغوية العامة (General-Purpose Large Language Models) تحديات في التعرف على الكيانات المالية بدقة، حيث تميل إلى تصنيفها بشكل خاطئ أو تجاهل الأنماط الخاصة بالمجال. في هذا السياق، يأتي البحث الجديد الذي يستعرض استخدام نموذج DeepSeek-R1-8B، وهو نموذج لغوي مفتوح المصدر، بالاشتراك مع تقنيات حديثة مثل التكيف منخفض الرتبة (Low-Rank Adaptation - LoRA) وتحسين التضمين الضوضائي (Noisy Embedding Fine-Tuning - NEFTune) لتحسين فعالية تحديد الكيانات المالية.

في دراستهم، قام الباحثون بتحويل كل جملة مشروحة في مجموعتهم المكونة من 1693 عينة إلى ثلاثيات تعليمية (instruction-input-output triples). إذ تم إدخال مصفوفات LoRA الخفيفة في طبقات المحولات (Transformer layers) وتطبيق NEFTune لتحسين قدرة النموذج على التعميم من خلال إضافة ضوضاء متسقة إلى المتجهات التضمينية أثناء التدريب. أظهرت التجارب أن نموذج DeepSeek-R1-8B المعزز بتقنية LoRA حقق معدل دقة متناهٍ (micro-F1) بلغ 0.901 عبر سبعة أنواع من الكيانات، تشمل الشركة، التاريخ، الموقع، المال، الشخص، المنتج، والكمية. ومع إضافة تقنية NEFTune، ارتفع هذا المعدل إلى 0.912، مما يجعله يتفوق على النماذج الأخرى مثل Llama3-8B وQwen3-8B وBaichuan2-7B وT5 وBERT-Base.

إذاً، هل نحن أمام تطور كبير في كيفية تعامل الذكاء الاصطناعي مع البيانات المالية؟ استعدوا لمشاهدة المزيد من الابتكارات المثيرة في هذا المجال!