في عالم الذكاء الاصطناعي، تمثل نماذج اللغات الضخمة متعددة النماذج (Multimodal Large Language Models) ثورة جديدة في طريقة معالجة البيانات، خصوصًا في المجالات العلمية المتخصصة مثل المجهر. ومع ذلك، كان هناك تحديات كبيرة تتعلق بنقص البيانات التدريبية الخاصة، وصعوبة تضمين المعرفة الدقيقة من قبل الخبراء في معلمات النموذج.
تدخلنا هنا لتقديم مشروع مايكرو وورد (MicroWorld)، وهو إطار عمل مبتكر يهدف لتقليص الفجوة بين البيانات المجهرية والمعرفة الفنية. يقوم مايكرو وورد ببناء رسم بياني ذو خصائص متعددة (Multimodal Attributed Property Graph - MAPG) اعتمادًا على مجموعة ضخمة من الصور العلمية وتعليقاتها، مما يعزز قدرة نماذج الذكاء الاصطناعي على الاستدلال في أوقات الاستعلام دون الحاجة إلى ضبط دقيق مخصص.
تتجلى عبقرية مايكرو وورد في كيفية استخراج الكيانات البيولوجية وعلاقاتها من خلال أدوات مثل scispaCy أو تعدين الثلاثيات عبر نماذج اللغات. يتم محاذاة الصور والكيانات ضمن مجال تمثيلي مشترك باستخدام تقنية Qwen3-VL-Embedding، وتجميع كل ذلك في قاعدة بيانات معرفة تحتوي على حوالي 111,000 عقدة و346,000 حافة نوعية، تمثل ثمانية فئات من العلاقات.
وعند وقت الاستعلام، تستخدم عملية استرجاع مدعومة بالرسم البياني لمطابقة الكيانات المستعلام عنها مع الـ MAPG، مما يضخ المعرفة الهيكلية في طلبات نموذج اللغات الضخمة. في اختبارات MicroVQA، أظهر مايكرو وورد تحسنًا في أداء الاستدلال لنموذج Qwen3-VL-8B-Instruct بنسبة 37.5%، متفوقًا على GPT-5 بنسبة 13%، ليحقق بذلك مستوى جديد من الأداء الفائق.
تحظى هذه التكنولوجيا بآفاق واسعة في تحسين القدرة على التعميم، مما يفتح الأبواب أمام المزيد من التطورات المستقبلية. كما تكشف دراسة حالة نوعية عن آليات تحسين الاستدلال بواسطة المعرفة الهيكلية وأوجه الفشل التي تشير إلى اتجاهات مثيرة للاهتمام.
يمكنكم الاطلاع على الكود والبيانات المرتبطة بهذا المشروع من خلال زيارة الرابط: [رابط الكود](https://github.com/ieellee/MicroWorld).
مايكرو وورد: ثورة في الذكاء الاصطناعي لتضييق الفجوة الميكروسكوبية!
يقدم مشروع مايكرو وورد (MicroWorld) نموذجًا مبتكرًا يجمع بين عوالم الصور والنصوص لتحسين أداء الذكاء الاصطناعي في مجالات علمية متخصصة. عبر استخدامه لنموذج الرسوم البيانية، يحقق مايكرو وورد تطورات ملحوظة في القدرة على الاستدلال العلمي.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
