في عصر الذكاء الاصطناعي، يخضع الذكاء الاصطناعي لاختبارات تقليدية مصممة لتقييم الصفات البشرية مثل الذكاء والشخصية. ولكن، هل يعكس ذلك فعلاً أي شيء عن القدرات الحقيقية للذكاء الاصطناعي؟ في دراسة جديدة منشورة على موقع arXiv، يُحتج بأن تطبيق اختبارات مصممة للبشر على نماذج الذكاء الاصطناعي يعد خطأً وجودياً.
تتناول الدراسة كيف نجحت نماذج اللغات الضخمة (Large Language Models) في اجتياز مجموعة من الاختبارات التي تم تطويرها في الأساس لتقييم سمات الإنسان. ومع ذلك، يُشير الباحثون إلى أن هذه النتيجة يمكن أن تؤدي إلى سوء تفسير القدرات الحقيقية للذكاء الاصطناعي.
تعتبر الاختبارات البشرية أدوات قياس قائمة على نظرية محددة، مصممة لتناسب مجموعة بشرية معينة. تنفيذ هذه الاختبارات على كيانات غير بشرية دون وجود دليل تجريبي يهدد بدوره تمييز الخصائص التي يتم قياسها أو حتى تأسيس معايير جديدة غير دقيقة.
يدعو الباحثون إلى تطوير أطر تقييم مبدئية خاصة بالذكاء الاصطناعي، بحيث تتناسب مع طبيعة النماذج الذكية ومتطلباتها الفريدة. هذه الأطر يمكن أن تستند إلى معايير موجودة لبناء اختبارات نفسية أو يمكن إنشاؤها من الصفر لتلائم السياق الخاص للذكاء الاصطناعي.
فبدلاً من الخلط بين أداء الذكاء الاصطناعي والمعايير البشرية، ينبغي علينا أن نستثمر في تطوير اختبارات موثوقة تبرز الفروق والفروق الدقيقة في قدرات الذكاء الاصطناعي. إن الوقت قد حان لنتحدى الطرق التقليدية وندعو للتغيير لصالح مستقبل أفضل.
توقفوا عن تقييم الذكاء الاصطناعي باختبارات بشرية! أطلقوا العنان لاختبارات مخصصة تتناسب مع طبيعة AI
تدعو دراسة جديدة إلى ضرورة التخلي عن استخدام اختبارات بشرية لتقييم الذكاء الاصطناعي، حيث ترى أن ذلك يخلق أخطاء في التفسير. بدلاً من ذلك، يجب تطوير اختبارات مخصصة تعكس الخصائص الفريدة للذكاء الاصطناعي.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
