في عالم متسارع يتسم بالتغيرات التكنولوجية، يظهر مفهوم جديد يجعل التفكير خارج نطاق النصوص أمراً ممكناً. نقدم لكم "Mull-Tokens"، وهي رموز كامنّة (latent tokens) لا تعتمد على نوع معين من البيانات، مما يسهل على الذكاء الاصطناعي التفكير بحرية في مختلف المجالات


المشكلة الكبيرة التي تواجهها النماذج متعددة الوسائط (multimodal models) الحالية هي ضعف المرونة وقلة القدرة على التوسع. فهي تعتمد على أدوات متخصصة أو إنتاج صور مكلفة، مما يجعل العملية معقدة ومرهقة. ولكن مع "Mull-Tokens"، يمكن للنماذج استخدام معلومات مختزنة في كل من النصوص والصور بشكل فعال.

من خلال استخدام استراتيجيات متقدمة في التدريب، يتم تدريب "Mull-Tokens" على البيانات المدمجة النصية-الصورية، ثم يتم تحسين أدائها دون الحاجة إلى إشراف، مما يعزز قدرة النموذج على التفكير بشكل أكثر نجاحًا. تمت تجربتها عبر أربعة اختبارات صعبة في التفكير المكاني، حيث أظهرت النتائج تحسيناً بمتوسط 3%، مع زيادات تصل إلى 16% في بعض الاختبارات.

بهذا، يوفر "Mull-Tokens" حلاً بسيطاً للتفكير المجرد في عدة مجالات، مما يضيف ونحن في نقاشات حول تحديات الربط بين التفكير النصي والتفكير المرئي. إذا كنتم من المهتمين بالتطورات الحديثة في الذكاء الاصطناعي، فلا تفوتوا هذه الفرصة للتعرف على هذا الابتكار المذهل.