تعتبر اللغة والثقافة مرتبطتان بشكل وثيق، ولا يُخفى على أحد أن الفهم العميق للعربية يتطلب معرفة باللهجات المختلفة التي تعكس تراث وممارسات المجتمعات العربية. ومع ذلك، كانت تقييمات الذكاء الاصطناعي، وتحديدًا نماذج اللغات الضخمة (Large Language Models)، تعاني من نقص في التركيز على السياقات الثقافية المتنوعة. حيث تركز معظم المعايير العربية المتاحة على نصوص قصيرة بلغة العربية الفصحى الحديثة (Modern Standard Arabic) دون الالتفات إلى الفروق الثقافية التي تنشأ في المحادثات اليومية.
لمواجهة هذه المشكلة، أُطلقت قاعدة البيانات ArabCulture-Dialogue، والتي تصف محادثات تغطي 13 دولة تتحدث العربية، وتُقدم في كل من العربية الفصحى واللهجات المحلية، متضمنة 12 موضوعًا يوميًا و54 موضوعًا فرعيًا دقيقًا. هذه القاعدة تمثل خطوة كبيرة في تقييم تفكير النماذج اللغوية في سياقات ثقافية واعتماد كل لهجة.
تشمل المهام التي تم تكوينها باستخدام هذه القاعدة: (1) التفكير الثقافي متعدد الخيارات، (2) الترجمة الآلية بين العربية الفصحى واللهجات، و(3) توليد النصوص الموجهة باللهجات. أظهرت التجارب أن الفجوة في الأداء لا تزال قائمة، حيث تؤدي النماذج أسوأ في تنفيذ المهام الثلاث في الإعداد باللهجات مقارنة بالفصحى.
هذه الخطوات تقدم فرصة جديدة لتطوير نماذج ذكاء اصطناعي أكثر فهما لمجتمعاتنا العربية، وتعتبر بمثابة دفعة قوية نحو تحسين أداء التكنولوجيا في التعامل مع الفروقات الثقافية. فهل يمكن أن تسهم مثل هذه التطورات في تحسين فهم النماذج للثقافة العربية المتنوعة؟
الثقافة في الذكاء الاصطناعي: قاعدة بيانات جديدة تعكس اللهجات العربية المتعددة!
تمتعت الذكاء الاصطناعي بفجوة كبيرة في تقييم التفكير الثقافي في المحادثات العربية. الآن، مع قاعدة بيانات ArabCulture-Dialogue، يمكن سد هذه الفجوة واختبار أداء نماذج الذكاء الاصطناعي في اللهجات العربية المتنوعة.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
