في ظل التحديات المستمرة التي تواجه تشخيص الطب الصيني التقليدي (Traditional Chinese Medicine - TCM)، خصوصًا عند فحص اللسان، يأتي إطار العمل MMIR-TCM ليقدم رؤية جديدة ومبتكرة. فعملية التشخيص التي يعتمد عليها الأطباء غالبًا ما تعاني من قابلية أضعف في التكرار والموضوعية، وهو ما يمثل عقبة أمام تطبيق الذكاء الاصطناعي متعدد الوسائط (Multimodal AI) في مجالات مثل تمييز المتلازمات وتوليد الوصفات. يعد الفجوة الدلالية بين الفيتات البصرية للسان والأسس النصية للتفكير أحد العوامل التي تعيق الاستفادة الكاملة من هذه التكنولوجيا.

تم تصميم إطار MMIR-TCM لاستخدام النموذج اللغوي الكبير (Large Language Model - LLM) المدعوم بالذاكرة لتقليد العملية التشخيصية لخبراء الطب الصيني. يعتمد هذا الإطار على هيكلية ثلاثية المراحل تشمل وحدة ذاكرة (Memory-SAM) لاستخراج اللسان بشكل قوي، ونموذج Qwen3-VL المُحسّن لتوليد تشخيص مركّز للسان، وأخيرًا مكون من نوع RAG يعتمد على Qwen3 لتوليد دعم سريري مرتكز على الأدلة.

تم تطوير هذا الإطار والتحقق من فعاليته باستخدام مجموعة بيانات جديدة وكبيرة متعددة الوسائط باسم MedTCM، التي أُطلقت خصيصًا لدعم الأبحاث المتقدمة في الطب الصيني. ولتقييم دقة الإطار سريرياً، تم ابتكار مقياس تقييم محدد يعتمد على الفهم الدلالي وأهمية التشخيص، وهو ما يعجز عن قياسه المؤشرات الحالية.

تظهر التجارب الشاملة التي أُجريت باستخدام MMIR-TCM أنه يتفوق بشكل ملحوظ على النماذج الرائدة، مثل GPT-4o وGemini 2.5 Flash. هل يمكن أن يكون هذا الإطار بداية جديدة في استخدام الذكاء الاصطناعي لتحسين نماذج التشخيص في الطب الصيني التقليدي؟