عالم الذكاء الاصطناعي: اختبارات الذكاء البصري تكشف أسرار قدرات نماذج اللغة متعددة الوسائط!

Q: ما هو موضوع مقال "عالم الذكاء الاصطناعي: اختبارات الذكاء البصري تكشف أسرار قدرات نماذج اللغة متعددة الوسائط!"؟

يتناول المقال بالتفصيل والتحليل آخر الأخبار والتطورات المتعلقة بـ "عالم الذكاء الاصطناعي: اختبارات الذكاء البصري تكشف أسرار قدرات نماذج اللغة متعددة الوسائط!" في عالم الذكاء الاصطناعي والتكنولوجيا الناشئة.

في عالم سريع التغير يكتسب فيه الذكاء الاصطناعي (AI) أهمية متزايدة، يكشف لنا اختبار جديد بعنوان 'عين العقل' (Mind's Eye) عن جوانب غير معروفة من القدرات البصرية لنماذج اللغة متعددة الوسائط (Multimodal Large Language Models). هذا الاختبار يجمع بين ثمانية مهام بصرية مستلهمة من اختبارات الذكاء البشري الكلاسيكية، ضمن تصنيف فريد يسمى 'A-R-T'، والذي يشمل التجريد (Abstraction)، العلاقة (Relation)، والتحول (Transformation).

يستهدف 'عين العقل' قياس العمليات الأساسية للذكاء السائل، مثل استنتاج الأنماط، ورسم العلاقات التناظرية، والتحول الذهني. في دراسة شاملة، تم تقييم أداء مجموعة متنوعة من نماذج اللغة الكبيرة، سواء كانت مغلقة المصدر أو مفتوحة المصدر، ومقارنتها بأداء المشاركين البشر.

كانت نتيجة الدراسات مثيرة للاهتمام؛ فقد حقق البشر دقة بلغت 80%، بينما ظلت أفضل نماذج MLLMs تحت 50%. فيما أظهر تحليل الأخطاء أن هناك نقصاً في ثلاث مجالات رئيسية: (i) تخصيص الانتباه البصري، (ii) التعامل الإدراكي الداخلي، و(iii) ضعف التجريد عن المفاهيم البصرية الأساسية.

تشير النتائج إلى أن نماذج MLLMs الحالية تعاني من قدرات محدودة في التفكير البصري المكاني عند مقارنتها بالبشر، مما يبرز الحاجة إلى تطوير أطر تقييم أكثر ترسيخاً في المعرفة العقلية. هل سيكون هذا الاختبار بداية لثورة في كيفية تقييم الذكاء الاصطناعي؟

عالم الذكاء الاصطناعي: اختبارات الذكاء البصري تكشف أسرار قدرات نماذج اللغة متعددة الوسائط!

شارك الخبر مع أصدقائك

📰أخبار قد تهمك

ثورة جديدة في عالم البرمجة: شركة Gitar الناشئة تؤمن الكود باستخدام الذكاء الاصطناعي!

جوجل تطلق ميزة الذكاء الشخصي جيمني في الهند: تجربة مخصصة في متناول يدك!

أوبن أيه آي تستحوذ على شركة هيرو لتكنولوجيا التمويل الشخصي: خطوة نحو التخطيط المالي الذكي!