تقييم الأداء في الظروف الحقيقية
أجريت الدراسة على مجموعة من المشاركين (N=112) في سيناريوهات مستوحاة من بيئات العمل، حيث يعتبر الالتزام بالقوانين المحلية والتعامل الآمن مع البيانات الحساسة من الأمور المهمة. تمت مقارنة أداء المتعاونين البشريين مع أنظمة RAG بنماذج تعتمد فقط على الذكاء الاصطناعي بدون تقييد.
حجم النموذج وتأثيره
تسعى الدراسة لفهم كيف يؤثر حجم النموذج (3B، 8B، و70B) في الديناميكية التعاونية بين البشر والذكاء الاصطناعي. وقد أظهرت النتائج أن هناك فائدة ملحوظة في أداء التعاون البشري مع أنظمة RAG مقارنة بالنماذج الأحادية، بغض النظر عن حجم النموذج المستخدم. لكن الجدير بالذكر هو أن رضا المستخدمين وسهولة الاستخدام لم تختلف بشكل كبير عبر أحجام النماذج.
التوازن بين الأداء والإدراك
تُظهر هذه النتائج توازناً معقداً بين حجم النموذج، والأداء، وإدراك المستخدم. بينما يحقق التعاون البشري مع أنظمة الذكاء الاصطناعي نتائج إيجابية، إلا أن الأبعاد النفسية للمستخدمين تبقى ثابتة. هذا يسلط الضوء على أهمية تقييم تطبيقات الذكاء الاصطناعي في الفعاليات التفاعلية مع المستخدمين، مع اعتماد مقاييس أكثر شمولية تشمل رضا المستخدم وسهولة الاستخدام بخلاف دقة الأداء فقط.
دعوة للتفاعل
ما رأيكم في هذه النتائج المثيرة؟ هل تعتقدون أن حجم النموذج يؤثر بشكل فعلي على التعاون البشري والذكاء الاصطناعي؟ شاركونا في التعليقات!
