تلخيص الوثائق المتعددة (MDS) هو عملية حيوية تهدف إلى استخراج المعلومات الضرورية من مجموعة من النصوص. لكن، كثيراً ما تواجه الأساليب الحالية تحديات في التقاط العلاقات المعقدة بين الوثائق، وتعتمد بشكل كبير على كميات ضخمة من البيانات المُعلمة للتدريب الخاضع للإشراف، مما يحد من قدرتها على التعميم عبر المجالات واللغات.

للتغلب على هذه التحديات، يسرنا أن نقدم إطار عمل مكون من مجموعة من الوكلاء (agents) لتلخيص الوثائق بشكل مبتكر، والذي لا يعتمد على التدريب. يتميز هذا الإطار بقدرته على الاستفادة من نقاط القوة التكميلية لكل من نماذج اللغات الضخمة (LLMs) والرسوم البيانية للمعرفة.

يعتمد هذا النهج على تفكيك عملية التلخيص إلى مهام متخصصة:
1. **الاختيار الاستخراجي (extractive selection)**: لاختيار المعلومات الأكثر أهمية.
2. **التحليل المدعوم بالمعرفة (knowledge-aware abstraction)**: لصياغة ملخصات معبرة.
3. **التحسين المتكرر (iterative refinement)**: لتحسين نتائج التلخيص.

كل من هذه المهام تعمل بدون الحاجة لتعديل دقيق مخصص (task-specific fine-tuning). ويتم توحيد المخرجات من خلال آلية توافق متعددة الزوايا مدفوعة بنماذج اللغات الضخمة.

أثبتت التجارب التي أُجريت على أربعة مجموعات بيانات باللغتين الإنجليزية والفيتنامية، أن هذا الإطار يحقق أداءً متميزًا أو منافسًا لمستويات الأداء الأخرى، مما يُظهر فعالية التصميم القائم على نموذج وحدات.

هل أنت مستعد لاكتشاف مستقبل تلخيص الوثائق؟ شاركونا برأيكم في التعليقات!