تشكل التقارير الخاصة بحوادث الملاحة مصدراً حيوياً لفهم الأسباب الجذرية لهذه الحوادث، ولكن استخراج البيانات الدقيقة من سجلات تمتد لعقود يمثل تحدياً كبيراً. في ورقة بحثية جديدة، تم اقتراح إطار عمل هجيني يعزز من قدرة تحليل السجلات البحرية باستخدام تقنيات متطورة.

يستفيد هذا الإطار من مجموعة بيانات شاملة تتضمن 13,329 تقريراً من لجنة السلامة البحرية الكورية، حيث تم تحويل البيانات الخام إلى قاعدة معرفة منظمة تحت مسمى "بطاقات الحوادث"، والتي تحتوي على ملخصات، أسباب، وقرارات أي حادث. كما تم تطوير تصنيف هرمي للأسباب، مما يسهل عملية البحث والتحليل.

تعتمد استراتيجية الاسترجاع على نهج هجيني مدرك للحقول، يجمع بين التصنيفات الضعيفة والكثيفة عبر تقنية دمج الترتيب العكسي (Reciprocal Rank Fusion - RRF). ولأن العلامات الخاصة بخبرة الخبراء كانت محدودة، تم تقييم أداء الاسترجاع باستخدام معايير متقدمة، مما أظهر تحسناً ملحوظاً في الأداء.

النتائج التجريبية جاءت لتشيد بكفاءة هذا النظام حيث ارتفعت معدلات الاسترجاع من 0.18 إلى 0.55، مما يعني استنتاجاً أسرع وأكثر دقة للأسباب الجذرية. بالإضافة إلى ذلك، استخدام هذه البيانات المحصلة لتحسين جودة التقارير مستندة على نماذج اللغات الضخمة (Large Language Models - LLM) أدى إلى تحسين كبير في دقة التحليل، مما يعكس أهمية هذا الابتكار في تعزيز أمان الملاحة البحرية بشكل كبير.

يعد هذا البحث خطوة جادة نحو تسريع عملية التحقيق في حوادث الملاحة وتقديم تقارير قائمة على أدلة حقيقية في أقل وقت ممكن، مما يساهم بشكل فعّال في منع تكرار تلك الحوادث في المستقبل.