يعتبر الذكاء الاصطناعي محركًا لتطور العديد من المجالات، ومن بين استخداماته الشائعة كتابة القصص. لكن دراسة جديدة تسلط الضوء على إشكالية التنوع في هذه القصص, حيث تبين عند استخدام 20,000 قصة مولدة من أربع نماذج حديثة بواسطة خمس عبارات أن 11 كلمة فقط تظهر في 88.3% من تلك القصص.

هذه الكلمات تشمل أسماء مثل (إيلياس، مَرا، إيلارا)، وأماكن مثل (المنارات)، ومهن مثل (صانع الساعات، أمين المكتبة). المثير للاهتمام أن هذه الكلمات ليست شائعة في الأدبيات المنشورة أو البيانات المستخدمة في تدريب النماذج، لكنها موجودة في بيانات تفضيل يُحتمل أنها استخدمت كمدخلات لجميع النماذج الحالية.

وعلى الرغم من شهرة هذه "القصص المرتبطة بالمنارة"، إلا أنها تبدو نادرة بالمقارنة مع معظم القصص الأخرى المنتجة بعد التدريب والتي تحتوي غالبًا على إشارات إلى شخصيات محمية بحقوق الطبع والنشر أو محتوى بالغ.

تشير هذه النتائج إلى التأثير المحتمل غير المتناسب لمجموعات البيانات الصغيرة عند دمجها مع خوارزميات المحاذاة القوية، مما يدفعنا للتساؤل: كيف يمكن تحسين تنوع القصص التي ينتجها الذكاء الاصطناعي؟ هل ينبغي إدخال المزيد من التنوع في البيانات التدريبية؟

هذا التطور يشكل دعوة لنتشارك الآراء حول كيفية تعزيز الابتكار في كتابة القصص من خلال نماذج اللغة الكبيرة. ما رأيكم في هذا التطور؟ شاركونا في التعليقات.