تواجه اللغات منخفضة الموارد تحديًا كبيرًا في مجال تطوير الذكاء الاصطناعي (AI) يتمثل في إنشاء أنظمة محادثة متخصصة دون وجود كميات هائلة من البيانات التدريبية. في خطوة جريئة نحو سد هذه الفجوة، يقدم الباحثون منهجية منظمة لتحويل الموارد اللغوية المنهجية إلى أنظمة ذكاء اصطناعي مخصصة.

تشير النتائج إلى أن قواعد البيانات اللغوية المُعدّة من قبل خبراء يمكن أن تشكل أساسًا قويًا لنماذج الذكاء الاصطناعي في مجال المحادثات. لطالما كان النموذج الأساسي هو قاعدة بيانات Hindi WordNet التي تم تحويلها إلى 1.25 مليون زوج من التعليمات والاستجابات المتنوعة.

استخدم الباحثون نموذج لغوي ضخم يحتوي على 12 مليار معلمة، وتم تحسينه باستخدام أسلوب LoRA الفعال في إدارة الموارد، والذي يتيح كميًا بدقة 4 بت. تم قياس نتائج الشكل التعليمي من خلال دردشة موجهة لتعليم اللغة الهندية حيث أظهرت الأنظمة المعتمدة على المعرفة المنظمة فعالية بيداغوجية رائعة تصل إلى 91%، في مقابل 79.4%-83.6% للنماذج العامة.

كما أن الأنظمة أثبتت قدرتها على الحفاظ على الأداء الدلالي التنافسي والاتساق الفائق. يظهر هذا البحث كدليل على مفهوم استخدام الموارد اللغوية في تطوير أنظمة ذكاء اصطناعي متخصصة، بما يمكن العديد من اللغات التي تمتلك موارد مشابهة من الاستفادة من هذه التكنولوجيا الحديثة. إن هذه العمل يمثّل بديلاً عمليًا للنهج المكثف في جمع البيانات، مما يتيح تطوير ذكي ومبتكر لأنظمة متخصصة في اللغات ذات الموارد القليلة.