في عالم الذكاء الاصطناعي، تزيد أهمية التفكير المعتمد على المعلومات البصرية بشكل مستمر، وخاصة في نماذج اللغات المرئية (Visual Language Models)، مثل Qwen3-VL-Thinking. تهدف هذه النماذج إلى تحسين أداء التفكير من خلال القيام بخطوات تفكير متتابعة قبل الوصول إلى الإجابة النهائية. لكن التكاليف الحاسوبية المرتفعة لهذه التقنيات تعيق استخدامها في العالم الحقيقي.

من هذا المنطلق، تم تقديم إطار عمل جديد يُعرف بـ "تقنيات تقطير التفكير المعتمد على المعلومات المرئية"، يركز على تحسين قدرة النماذج على الاستفادة من الأدلة البصرية خلال عمليات التفكير. يعزز هذا الإطار قدرة الطلاب (النماذج) على التركيز على المعلومات المرئية من خلال إخفاء أجزاء بارزة من التفكير النصي.

تشمل استراتيجيات الإخفاء المستخدمة: 1) إخفاء أجزاء بارزة من التفكير بشكل انتقائي، و2) جدول زمني لزيادة معدل الإخفاء تدريجيًا وفقًا لصعوبة التقطير، والتي تقاس من خلال التباين بين توزيعات المعلم والطالب.

تشير النتائج التجريبية إلى أن هذه الطريقة تتفوق على نماذج التعلم العميق المفتوحة المصدر، وتقنيات التقطير الذاتي، في اختبارات التفكير متعدد الأنماط. التحليلات الإضافية تؤكد تعزيز استخدام المعلومات المرئية خلال تسلسل التفكير في الطالب.

هذه التطورات تفتح آفاقًا جديدة أمام العلماء والمطورين لابتكار نماذج أكثر ذكاءً وقدرة على التفكير المرئي، مما قد يحدث ثورة في الذكاء الاصطناعي.