في عالم الذكاء الاصطناعي، تلعب القصص الأخلاقية دورًا كبيرًا في نقل القيم والمبادئ، ولكن رغم ذلك، كانت هناك فجوة ملحوظة في قواعد البيانات المنسقة التي تجمع بين الروايات المتماسكة والدروس الأخلاقية الواضحة. لذا، يُسعدنا أن نعلن عن إطلاق مجموعة بيانات TF1-EN-3M، التي تعد الأولى من نوعها والتي تتضمن ثلاثة ملايين حكاية أخلاقية باللغة الإنجليزية تتم توليدها بشكل حصري باستخدام نماذج تعلم آلي لا تتجاوز 8 مليارات معلمة.

كل قصة تنبع من هيكل موحد يتكون من ستة عناصر رئيسية: الشخصية، السمة، المكان، الصراع، الحل، والدروس الأخلاقية، وقد تم إنتاجها من خلال محرك توليد مبتكر يضمن الحفاظ على جودة السرد في مختلف المواضيع.

وبالإضافة إلى ذلك، يتضمن المشروع أيضًا بايبلين (pipeline) تقييم يمكن تكراره بالكامل، حيث قام مجموعة من القضاة من نماذج لغوية مفتوحة بتقييم القصص بناءً على معايير متعددة مثل القواعد، والابتكار، والوضوح الأخلاقي، والإلتزام بالقالب، إلى جانب قياس التنوع وقابلية القراءة.

من بين عشرة نماذج توليدية مفتوحة، كانت النسخة ذات الثمانية مليارات معلمة من نموذج Llama-3 هي الأفضل من حيث الجودة والتكلفة، حيث تنتج قصصًا ذات تقييمات مرتفعة بتكلفة تقارب 0.135 دولار لكل 1000 قصة.

مشروع TF1-EN-3M لا يساهم فقط في تعزيز التعليم الأخلاقي، بل يفتح أيضًا آفاقًا جديدة للبحث في مجالي الذكاء الاصطناعي وتقنيات التعلم الآلي، مما يُظهر أن السرد الأخلاقي على نطاق واسع يمكن أن يتحقق دون الحاجة إلى نماذج عملاقة أو بنية تحتية تقييمية مكلفة. هل أنتم مستعدون لاستكشاف هذا المحتوى الرائع وتطبيقاته التعليمية؟