أحدثت نماذج اللغات الضخمة (LLMs) ثورة في عالم الذكاء الاصطناعي؛ ولكن تبين أنها قد تواجه تحديات في التقاط الحكم البشري بشكل دقيق. يعزي ذلك إلى كونها تعاني من عدم الاستقرار في تقديرها للأحكام البشرية، بجانب عدم قدرتها على التقاط التوزيعات الكاملة للاستجابات.

في دراسة جديدة نشرت على arXiv، تم استكشاف كيفية تحسين دقة المشغلات التي يتم استخدامها مع هذه النماذج. وقد أظهرت النتائج أهمية استخدام استراتيجيات بسيطة لتحفيز نماذج اللغات الضخمة. على سبيل المثال، من خلال مطالبة النماذج بتقارير عن الانحرافات المعيارية ونسب الاستجابات، تمكن الباحثون من استعادة النطاق الكامل للاستجابات البشرية بصورة أفضل.

علاوة على ذلك، أكدت الدراسة على ضرورة تقديم سيناريوهات واضحة للمشاركين، وذلك لما لذلك من أثر مباشر في زيادة توافق النموذج مع الحكم البشري. وقد تبيّن أيضاً أن هذه النماذج قادرة على تتبع تصنيفات الارتباك لدى البشر، مما يعكس قدرتها على فهم مدى وضوح السيناريوهات المقدمة.

لكن يبدو أن تقديرات نماذج اللغات الضخمة لخطأها الخاص ليست دقيقة كما ينبغي، بالرغم من قدرتها على التنبؤ بتباين الاستجابات البشرية بشكل جيد.

تؤكد هذه النتائج على أنه من خلال صياغة أسئلة ملائمة، يمكن أن نحصل على إجابات أكثر دقة وموثوقية من نماذج اللغات الضخمة. لذا، إذا كنت تبحث عن تحسين تفاعل الذكاء الاصطناعي مع الحكم البشري، فإن تحسين صياغة الأسئلة هو المفتاح!