في ظل التقدم الكبير في أنظمة "العالم الآلي" (AI scientist)، أصبح بالإمكان الآن كتابة مسودات الأبحاث العلمية وكتابة الأكواد بشكل تلقائي. ومع ذلك، تظل عملية إنتاج الرسوم البيانية العلمية ذات الجودة المطلوبة، مثل الرسوم الترويجية، عقبة كبيرة في هذا المسار. فهذه الرسوم ليست مجرد تزيين بل تلعب دورًا استراتيجيًا في تقديم المعلومات وتجذب الانتباه.

لذا، تم تطوير DiagramBank، وهي قاعدة بيانات ضخمة تتضمن 89,422 رسمًا بيانيًا مخططًا تم جمعها من منشورات علمية رائدة. تم تصميم هذه القاعدة لتسهيل الاسترجاع المتعدد النماذج وتوليد الرسوم البيانية العلمية باستخدام أمثلة مرشّدة. يعتمد نظام DiagramBank على آلية انتقاء تلقائية تقوم باستخراج الرسوم البيانية والمراجع النصية ذات الصلة، مستخدمة فلتر قائم على نموذج CLIP لتمييز الرسوم البيانية عن المخططات التقليدية أو الصور الطبيعية.

كل مثال في قاعدة البيانات مرتبط بسياق غني يحتوي على ملخص، تفسير، وزوج المراجع، مما يمكّن الباحثين من استرجاع المعلومات بطرق مختلفة. كما تم إطلاق DiagramBank بتنسيق جاهز للفهرسة، بالإضافة إلى توفير شفرة برمجية لتوضيح كيفية توليد الرسوم البيانية الترويجية باستخدام الأمثلة المتاحة. يمكن الآن للجميع الوصول إلى DiagramBank عبر هذا [الرابط](https://huggingface.co/datasets/zhangt20/DiagramBank) وشفرة البرمجة عبر [GitHub](https://github.com/csml-rpi/DiagramBank).

هل تعتقد أن مثل هذه القواعد يمكن أن تحدث ثورة في مجالات البحث العلمي؟ شاركونا آراءكم في التعليقات!