في خطوة هامة نحو تعزيز لغة الإشارة في بنغلاديش، تم الإعلان عن تطوير أول مجموعة بيانات تسمح بتحويل النصوص البنغالية إلى إشارات (gloss) تهدف إلى مساعدة ذوي الإعاقة السمعية. توضح الدراسات أن هناك أكثر من 3 ملايين شخص في بنغلاديش يعانون من ضعف السمع، ورغم ذلك، لم تتلق لغة الإشارة البنغالية (BdSL) الاهتمام الكافي في الأبحاث.

تتكون مجموعة البيانات الجديدة من 1,000 زوج من الجمل البنغالية المعلّمة يدويًا و4,000 جملة مُولّدة اصطناعياً، بالإضافة إلى 159 زوجًا تم تقييمه من قبل خبراء. باستخدام إطار عمل تجريبي، أُجري تحليل مقارن بين عدة نماذج مفتوحة المصدر ونموذج مغلق المصدر رائد، مما ساهم في تقييم الأداء في ترجمة BdSL ذات الموارد المحدودة.

لقد أثبت نموذج GPT-5.4 تفوقه بشكل عام، بينما قدم نموذج mBART المُعدّل أداءً منافسًا على الرغم من كونه أصغر بنسبة 100%. وكشف التقييم البشري أن نموذج Qwen-3 قد تفوق على جميع النماذج الأخرى.

تأتي هذه الدراسة لتؤكد فعاليتها في استخدام البيانات الاصطناعية كحل لمواجهة التحديات في ترجمة لغات الإشارة، مما يسهم في سد الفجوة بين اللغات المكتوبة والمُكتوبة.