في عالم يتطلب فهم الأعمال الفنية تفكيرًا متعدد الخطوات يجمع بين المحتوى البصري والسياق الثقافي والتاريخي، جاء الابتكار الجديد A-MAR (Agent-based Multimodal Art Retrieval) ليحدث ثورة في كيفية استرجاع وفهم الفنون الجميلة. بينما برزت نماذج اللغات الضخمة (Large Language Models) كأدوات واعدة لتفسير الأعمال الفنية، إلا أن اعتمادها على التفكير الضمني والمعرفة المدمجة حدَّ من قدرتها على توفير تفسيرات واضحة ودقيقة.
تعتمد A-MAR على إطار عمل مبتكر يمكّن من استرجاع الأدلة بطريقة مشروطة بتخطيط منظم. فعند معالجة أي عمل فني أو استفسار من مستخدم، يقوم نظام A-MAR بتجزئة المهمة إلى خطة تفكير هيكلية تحدد الأهداف ومتطلبات الأدلة لكل خطوة. هذه العملية لا تساهم فقط في تحسين استرجاع الأدلة، بل تدعم أيضًا تقديم تفسيرات موزعة ودقيقة خطوة بخطوة.
للتحقق من فعالية هذا الإطار في مجال الفنون، تم تقديم معيار جديد باسم ArtCoT-QA، الذي يتضمن سلاسل استدلال متعددة الخطوات لمجموعة متنوعة من الاستفسارات المتعلقة بالفنون. تُظهر التجارب التي أجريت على بيانات SemArt وArtpedia أن A-MAR يتفوق باستمرار على أساليب الاسترجاع الثابتة وأيضًا على النماذج المتطورة في جودة التفسير النهائي.
تبرز هذه النتائج أهمية استرجاع مبني على التفكير المنظم لفهم متعدد الجوانب ومكثف للمعرفة، مما يمهد الطريق أمام أنظمة ذكاء اصطناعي مستندة إلى الأهداف، خصوصًا في الصناعات الثقافية. لمزيد من المعلومات، يمكنكم زيارة [الرابط] (https://github.com/ShuaiWang97/A-MAR).
A-MAR: إطار فريد لاسترجاع الفنون الجميلة بمعونة الذكاء الاصطناعي
يقدم A-MAR طريقة مبتكرة لفهم الأعمال الفنية من خلال استرجاع مدعوم بالتفكير المنظم. يمثل هذا الإطار تحولاً جديداً نحو أنظمة ذكاء اصطناعي أكثر قابلية للتفسير في المجالات الثقافية.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
