تشهد نماذج اللغات الضخمة (Large Language Models) تطورًا ملحوظًا في الأداء من خلال تقنيات التطابق مثل التعلم المعزز من تغذية الإنسان (Reinforcement Learning from Human Feedback) والذكاء الدستوري (Constitutional AI). ومع هذا التطور، ظهرت ظاهرة تثير الانتباه بشكل متزايد: تصاعد وجود التكرارات اللغوية.

تشمل هذه التكرارات أنماطًا لغوية متكررة وصياغات نمطية تظهر في مخرجات النماذج. فمن العبارات المدح الخاطفة مثل "هذا سؤال عظيم!" و"رائع!"، إلى التأكيدات الزائفة التعاطف مثل "أنا أفهم قلقك تمامًا"، وكذلك المفردات المفرطة الاستخدام مثل "يتعمق" و"نسيج" و"معقد".

في هذه الدراسة، نفذنا تحليلًا منهجيًا لظاهرة التكرارات اللغوية عبر ثماني نماذج لغات متقدمة: GPT-5.4 وClaude Opus 4.7 وGemini 3.1 Pro وGrok 4.2 وDoubao-Seed-2.0-pro وKimi K2.5 وDeepSeek V3.2 وMiMo-V2-Pro. باستخدام إطار تقييم مخصص لتقييمات تعتمد على واجهة برمجة التطبيقات، قمنا بتحليل 10,000 طلب عبر 10 فئات مهام باللغتين الإنجليزية والصينية، مما نتج عنه 160,000 رد من النماذج.

قدمنا أيضًا مؤشر التكرار اللغوي (Verbal Tic Index) كمعيار مركب يقيس انتشار هذه التكرارات، وقمنا بتحليل ارتباطه بالمدح الزائف وتنوع المفردات وملاءمة التجربة البشرية. وكشفت النتائج عن تباين كبير بين النماذج، حيث سجلت نموذج Gemini 3.1 Pro أعلى مؤشر (0.590) بينما حقق نموذج DeepSeek V3.2 أدنى مؤشر (0.295).

نوضح أيضًا كيف تتزايد التكرارات خلال المحادثات متعددة الأدوار، وتزداد بوضوح في المهام الذاتية، وتظهر أنماطًا مميزة عبر اللغات المختلفة. أكدت التقييمات البشرية (N = 120) وجود علاقة عكسية ملحوظة بين المدح الزائف والملاءمة المدركة (r = -0.87، p < 0.001).

تسلط هذه النتائج الضوء على "ضريبة التطابق" التي تواجهها أنظمة التدريب الحالية وتبرز الحاجة الملحة إلى أطر تفاعل إنسان-ذكاء اصطناعي أكثر واقعية.