يواجه التعرف على الشخصيات المركبة المكتوبة بخط اليد في اللغة البنغالية تحديات كبيرة ناجمة عن تعقيد الهياكل الحرفية والتباين الكبير داخل الفئة الواحدة، بالإضافة إلى نقص البيانات الموثوقة المعلّمة. غالبًا ما تكافح أنظمة التعرف الحالية للتكيف مع أنماط الكتابة المختلفة، خصوصًا عندما يتعلق الأمر بالشخصيات المركبة التي تحتوي على روابط معقدة وتنوعات تنغيمية.
في عملنا الجديد، نقدم إطار عمل مبتكر يعتمد على تحسين انتشار البيانات (Diffusion Augmentation) المدعوم بالثقة والذي يتيح التعرف على الشخصيات المركبة البنغالية في دقة منخفضة. يجمع هذا الإطار بين نمذجة الانتشار الشرطية الجامدة (Class-Conditional Diffusion Modeling) وتوجيه المصنف (Classifier Guidance) لتوليد عيّنات عالية الجودة من الشخصيات المركبة المكتوبة بخط اليد.
لتعزيز جودة التوليد، أضفنا وحدات تعزيز الضغط (Squeeze-and-Excitation Enhanced Residual Blocks) داخل هيكل الشبكة العصبونية من نوع (U-Net) لنموذج الانتشار. كما قدمنا آلية تصفية تعتمد على الثقة، حيث تعمل المصنفات المدربة مسبقًا كحواجز للفحص النوعي للاحتفاظ فقط بالعيّنات الاصطناعية المتناسقة بشكل كبير. يتم دمج الصور الاصطناعية المصفاة مع بيانات التدريب الأصلية واستخدامها لإعادة تدريب عدة هياكل تصنيف.
أظهرت التجارب التي أُجريت على مجموعة بيانات الشخصيات المركبة AIBangla تحسينات أداء مستمرة عبر نماذج ResNet50 وDenseNet121 وVGG16 ونموذج نقل الرؤية (Vision Transformer). النموذج الذي حقق أفضل أداء وصل إلى 89.2% من دقة التصنيف، ما يتجاوز بشكل كبير المعيار السابق المنشور من AIBangla.
تؤكد النتائج أن تحسين انتشار البيانات يكون فعالًا في تعزيز أداء التعرف على الشخصيات المكتوبة بخط اليد في مجالات النصوص ذات الموارد المحدودة. يبدو أن هذا التطور يتجه بنا نحو مستقبل مشرق في فك شفرات الكتابة اليدوية، مما يفتح الآفاق لتطبيقات أوسع.
ما رأيكم في هذه التقنية الجديدة؟ هل تعتقدون أنها ستُحدث فرقًا في التعرف على نصوص اللغات الأخرى؟ شاركونا في التعليقات!
ثورة في التعرف على الشخصيات المركبة البنغالية: تقنية جديدة تعزز الدقة والموثوقية!
تقدم دراسة جديدة تقنية مبتكرة تعتمد على تحسين انتشار البيانات لفك التشفير الدقيق للشخصيات المكتوبة بخط اليد من نوع 'بنجالي'. هذه الطريقة تُظهر أداءً متفوقًا في تحقيق دقة عالية، مما يمهد الطريق لمستقبل واعد في هذا المجال.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
