في عالم الذكاء الاصطناعي، تُعد تقارير التوليد المعتمدة على الاقتباسات (Citation-backed reports) من أهم الاستخدامات، خصوصاً في أنظمة التوليد المدعومة بالاسترجاع (Retrieval-Augmented Generation - RAG). ومع أن هناك أدوات مفتوحة المصدر موجودة لمختلف مهام RAG، إلا أن الأدوات المخصصة لتوليد التقارير كانت تفتقر إلى الوجود.

لذلك، نقدم لكم Auto-ARGUE، الابتكار الحديث الذي يعتمد على نماذج اللغات الضخمة (Large Language Models) وينفذ الإطار المقترح حديثاً ARGUE لتقييم توليد التقارير.

قدّم فريق البحث تحليلًا شاملًا لأداء Auto-ARGUE باستخدام مهام توليد التقارير من مسار NeuCLIR في TREC 2024، بالإضافة إلى مهمتين من مسار RAG في نفس المسابقة، حيث أظهر النظام مستويات جيدة من التوافق مع الأحكام البشرية.

لتعزيز تجارب المستخدمين، أطلقنا أيضًا ARGUE-Viz، وهو تطبيق ويب يتيح تصور وتحليل دقيق لقرارات Auto-ARGUE ودرجاتها، مما يعطي المستخدمين القدرة على فهم النتائج بشكل أعمق.

إن ابتكارات مثل Auto-ARGUE تمثل الخطوة التالية نحو تحسين جودة وأداء الأنظمة القائمة على الذكاء الاصطناعي في مجالات متعددة، ودون شك ستساهم في تسريع التقدم في هذا المجال.

ما رأيكم في هذه التطورات الجديدة؟ هل تعتقدون أن Auto-ARGUE ستحدث فرقًا في جودة التقارير؟ شاركونا آرائكم في التعليقات!